题解 | #大小写混乱时的筛选统计#
大小写混乱时的筛选统计
http://www.nowcoder.com/practice/81cb12931a604811ae69d332515c7734
问题解释:试卷的类别tag可能出现大小写混乱的情况
要求: 请先筛选出试卷作答数小于3的类别tag,统计将其转换为大写后对应的原本试卷作答数。
如果转换后tag并没有发生变化,不输出该条结果。
思路:
让我筛选出试卷作答数小于3的类别tag,我就想先筛选出所有tag 及各自的 作答数。要求所有的tag,就要以examination_info表为主表,这样的tag才全。
# 1.查询 所有tag 各自的 总答题数
select tag ,count(start_time) cnt
from examination_info ei
left join exam_record er on ei.exam_id=er.exam_id
group by tag
/*结果:
算法|4
C++|6
c++|2
sql|1
SQL|0
*/
然后我看到题目给的解释,‘被作答过的试卷有9001/9002/9003/9004’这句话表明解释是以exam_record为主表进行的。那尝试以解释的思路得到试卷作答数小于3的类别tag
#2. 查询 作答次数小于3的tag
select tag
from exam_record er
join examination_info ei on er.exam_id=ei.exam_id
group by ei.exam_id
having count(start_time) <3
/*结果:
c++
sql
*/
我们要统计将其转换为大写后对应的原本试卷作答数,同时看到示例结果,第一列是初始的tag,第二列是变大写后对应的数量。因此我考虑将上面得到的两表连接。
以表2为主。连接条件是大写的表2.tag=表1.tag
解释中有一句“转为大写后只有C++本来就有作答数” ,那结果就剔除那些转为大写后 没有作答数的 : where cnt <>0
要求“如果转换后tag并没有发生变化,不输出该条结果”, 因此再剔除那些 大写tag和本身tag相同的:a.tag <> upper(a.tag)
最终代码:
#3.将表1和表2连接一起 通过大写的表2.tag =表1.tag
select a.tag , cnt
from (
select tag
from exam_record er
join examination_info ei on er.exam_id=ei.exam_id
group by ei.exam_id
having count(start_time) <3
) a
join (
select tag ,count(start_time) cnt
from examination_info ei
left join exam_record er on ei.exam_id=er.exam_id
group by tag
) b
on UPPER(a.tag)=b.tag
where cnt <> 0
and a.tag <> upper(a.tag) ##如果转换后tag并没有发生变化,不输出该条结果