题解 | #每篇文章同一时刻最大在看人数#
每篇文章同一时刻最大在看人数
https://www.nowcoder.com/practice/fe24c93008b84e9592b35faa15755e48
# 第一步
# 首先要把In 和 out提取出来 作为一个cnt in 加1, out 减1
# 先将提取出的表Union 合并
# 选择union all 因为可能会存在同一个视频观看时间相同的情况
# 如果有要筛选的条件 先筛选完再合并
# 第二步
# 将第一步的总表创建一个临时表 记为t1
# 使用滑动窗口 计算出每个时刻的总在线人数
# 易错点:sum(cnt) over(partition by artical_id order by time, cnt desc) as sumcnt
# cnt desc# 需要注意的是, 当同一时刻有人退出又有人进入时, 先计算进入的. 则还需要根据code 进行降序
# 第三步
# 分组 再选择 最大在线人数
# 第一步和第二步要分开 不能 max(sum(cnt) over) 这样不对 窗口函数和聚合函数 的嵌套、
# 窗口函数不能嵌套在窗口函数或其他聚合中,但分组聚合函数可以嵌套在窗口函数中,比如
# select b,c
# --,SUM( SUM(c) over() ) over() --错误,窗口函数不能嵌套于窗口函数中
# ,SUM(SUM(c)) OVER() --正确,因为内部的SUM(c)没有OVER子句,所以该函数 --是分组聚合函数而非窗口函数,这种情况的嵌套是允许的
# from T4 group by b,c
# 第一次写的代码 where artical_id !=0 这个限定条件写在了 最后】 # 最好的方法 是 在一开始合并数据集的时候 就把条件筛选完 /* with t1 as ( select id,uid,artical_id, in_time as time ,1 as cnt from tb_user_log union all select id,uid,artical_id ,out_time as time,-1 as cnt from tb_user_log ), t2 as (SELECT * , sum(cnt) over(partition by artical_id order by time) as sumcnt from t1 ) SELECT artical_id,max(sumcnt) as max_uv from t2 where artical_id !=0 group by artical_id order by max_uv desc; */
# 还有一个情况是 # 需要注意的是, 当同一时刻有人退出又有人进入时, 先计算进入的. 则还需要根据code 进行降序 # sum(cnt) over(partition by artical_id order by time) as sumcnt 需要再order by cnt (当同一世界有人进有人出 先算进入的 所以要降序排列) with t1 as ( select id,uid,artical_id, in_time as time ,1 as cnt from tb_user_log where artical_id !=0 union all ## 这里需要使用union all, 可能会存在同一个视频观看时间相同的情况 select id,uid,artical_id ,out_time as time,-1 as cnt from tb_user_log where artical_id !=0 ), t2 as (SELECT * , # sum(cnt) over(partition by artical_id order by time) as sumcnt # # 需要注意的是, 当同一时刻有人退出又有人进入时, 先计算进入的. 则还需要根据code 进行降序 sum(cnt) over(partition by artical_id order by time, cnt desc) as sumcnt from t1 ) SELECT artical_id,max(sumcnt) as max_uv from t2 # where artical_id !=0 不写在这 group by artical_id order by max_uv desc;