题解 | #连续两次作答试卷的最大时间窗#(莫名其妙居然给完成了)
连续两次作答试卷的最大时间窗
http://www.nowcoder.com/practice/9dcc0eebb8394e79ada1d4d4e979d73c
我一般开始做题之前都会想一下解题的思路,然后写在第一行,方便我自己进行下去,也便于后续打开网页来进行复习。
这题我做了很长时间,从3.13晚上看完题目开始,当时是不知道怎样建立一个类似的窗口函数来做这题,所以第二天上课的时候,我就在手机上看题解,再去博客网站上找类似的相关函数教学来看,所以在3.14上午的时候我大概就有思路来写了。
起初我是有进行连表的,就是建立窗口函数之后,我还做了个内联结,不管我选择using() start_time还是uid都会出现多出来一两张试卷的情况,我就觉得不对劲。我开始去找出联结后的表的样子,(我因为太久没使用过我的sql sever,知识点差不多全忘了,新的mysql又还不太熟练。)我是直接在牛客网页上进行的取数来一个一个找,(找得到bug就有意思,找不到就很折磨)发现了联结出有很大的问题,就是uid和start_time新旧两表中有相同的值,所以会出现笛卡尔积重复的情况,就会出现很多的复杂的问题,当然这个复杂的问题我没有去想怎么解决。(因为取数挨个找的时候我被消耗了太多精力。)我想到不联结也能找到我想要的东西,因为所有的计算相关的就是三个值嘛,uid start_time,st2,所以,我把联结删了,我开始直接在新表里面取数。可惜我还是没有取到,因为我使用的 第6,7行那样的算法,没能算出来,而且这道题很离谱,我每次改一些代码,网页提供的数据就会发生改变,这一次最大时间窗直接来到了213天,我人都傻了,我又改了一些代码,做了一些调试还是没能找到,我一道题花了很长时间思考,巨离谱,关键是人也麻了。我直接开始摆烂,回宿舍玩游戏去了。玩到了3.15 13:30左右,起初我还是没做出来,还是和前一天晚上的结果一模一样,我如法炮制继续取数一个一个找,最后知到了答案的算法没问题,是我的算法部分出了问题,我开始转换计算天数的方法,就是使用datediff的方法算,巧了正好每改成一个datediff,取数都会有变化,我最后把能改的都改出来就正好,弹出成功窗口了。不过可惜的是,我现在也没能想明白为什么会出现这样的错误。
# 思路: 选出2021答过题和答题数至少两天的人 最大时间窗和 平均答卷数都是在select里面可以完成的
# 新思路:不需要联结了,直接在包含st2 和start_time的表里面进行计算就好了。
#select uid,start_time,st2
#select er.uid,
# max((max(p.start_time) - min(p.start_time))+1)+1 as days_window,
# (count(max((day(p.st2) - day(p.start_time))) + p.start_time) / ((max(p.start_time) - min(p.start_time))+1) ) * (max((day(p.st2) - day(p.start_time)))+1) as avg_exam_cnt
select uid,#,start_time,st2,
max(datediff(st2,start_time))+1 as days_window,
round((count(uid) / ( datediff( max(start_time),min(start_time) )+1) ) * ( max(datediff(st2,start_time))+1),2) as avg_exam_cnt
from (
select uid,start_time,
lead(start_time,1) over(partition by uid order by start_time) as st2
from exam_record
) p
where year(start_time) = '2021'
and uid in (select uid
from exam_record
where year(submit_time) = '2021' and submit_time is not null
group by uid
having count(distinct date_format(submit_time,'%Y%m%d')) >= 2 )
#and er.submit_time is not null
group by uid
order by days_window desc,avg_exam_cnt desc