2022-05-19 20:39 已编辑中国人民大学数据分析师

关注

题解 | #每篇文章同一时刻最大在看人数#

每篇文章同一时刻最大在看人数

http://www.nowcoder.com/practice/fe24c93008b84e9592b35faa15755e48

方法一：

思路：

原始数据

易错点：要筛去 artical_id=0的数据 2. 时刻的选取 alt

题目要求“同一时刻”，而时间是连续变量，该选取什么时刻作为关注对象呢？根据例题画出了上图，可以直观发现，每一个有人进出的时刻都会人数变化，不妨取进出时刻为“关键时刻”point_time。
in_time和out_time都是point_time，同时选取表格中的不同变量，可以分别选取再用union连接
易错点！！！一定要用union，而不是union all！！！ （笔者因为这个问题卡了一下午）

前者去重，后者不去重。若不去重，后续统计同一时刻在看的总人数时，会重复计算同时有进出的时刻的人数，导致结果错误

是否在看的判断标准

题目提到，若同一时刻有人进入也有离开，先记录进入，再记录离开，也就是同一时刻会对应两个总人数值，两值相差1。但既然题目最终只要求最大人数，对于同时有进出的时刻，我们不妨只取进入未离开的状态，也就是更大的总人数。
由此，将每个用户观看的时间段与point_time对照，判断某时刻某用户是否在看： if(point_time between in_time and out_time,1,0)

代码

取关键时刻point_time表q1

select artical_id,in_time as point_time
    from tb_user_log 
    where artical_id!=0
    union all 
    select artical_id,out_time as point_time
    from tb_user_log
    where artical_id!=0
order by artical_id,point_time

若不去重（union all）
若去重（union）

对每个point_time，统计所有用户在看情况，得到表q

select q1.artical_id,point_time,
   sum(if(point_time between in_time and out_time,1,0)) as uv
   from 
    (
select artical_id,in_time as point_time
    from tb_user_log 
    where artical_id!=0
    union 
    select artical_id,out_time as point_time
    from tb_user_log
    where artical_id!=0
order by artical_id,point_time
) as q1
   join tb_user_log as q2
   on q1.artical_id=q2.artical_id
   group by artical_id,point_time

拼接结果（部分）

alt alt

拼接结果整合（按id和日期sum后)

取每篇文章同一时刻最大在看人数

select artical_id,max(uv) as max_uv
from 
  (select q1.artical_id,point_time,
   sum(if(point_time between in_time and out_time,1,0)) as uv
   from 
    (
select artical_id,in_time as point_time
    from tb_user_log 
    where artical_id!=0
    union 
    select artical_id,out_time as point_time
    from tb_user_log
    where artical_id!=0
order by artical_id,point_time
) as q1
   join tb_user_log as q2
   on q1.artical_id=q2.artical_id
   group by artical_id,point_time) as q
group by artical_id
order by max_uv desc

若不去重，所得结果：所以一定要去重啊朋友们！！！

方法二：

题解区大部分友友的思路：

同样取关键时刻，但对进出予以区分，进diff=+1，退diff=-1
按时间排序后巧用**sum()over(partition by order by)**可得截止每个关键时刻的总人数
易错点：先进后出，故sum(diff)时不但要time asc，还要diff desc

代码：

select artical_id,max(uv) as max_uv
from 
  (select q1.artical_id,point_time,
   sum(diff) over (partition by artical_id order by point_time,
                  diff desc) as uv
   from 
    (select artical_id,in_time as point_time, 1 as diff
    from tb_user_log 
     where artical_id!=0
    union all 
    select artical_id,out_time as point_time,-1 as diff
    from tb_user_log
    where artical_id!=0
    order by artical_id,point_time) as q1
   ) as q2
group by artical_id
order by max_uv desc

两方法对比：

易错点：

方法一由于最终取最大值，不考虑同时有进出时刻的“出”情况，故不区分in和out，但易错点也在于此，既然要sum，就要记得给point_time去重。
方法二区分了in和out，但易错点在于区分过后就要规定好先后，不然最大值就会受到影响。

思路本质：

方法一将时间段与时间点对照，但从结果出发取了巧，但偷懒也有偷懒要考虑的后果。
方法二只考虑时间点间的跳跃，只需要更严格的顺序要求便可由简洁的思路得到严谨的结果。

内存（虽然不太懂内存这些，但体感）

方法一会占用更多内存，若除id=0的情况有n条数据，那么point_time有2n个，并要逐一与n个时间段进行对照，则join后的表格会有2n*n条数据，大可不必如此！
方法二只需对2n个关键时刻进行窗口运算即可。

全部评论

推荐最新楼层

牛客290659675号

武汉工程大学数据分析师

第一个方法因为你用的是between，所以包含了结束时间段进来的情况，用union刚好帮你去重掉了这部分

点赞回复分享

发布于 2023-05-10 20:40 浙江

02-20 16:06

上海大学运营

快手产品运营一面😏凉了也赚了

真心建议大家大胆海投，把面试当成升级打怪，面一个挂一个后我也是练就超绝厚脸皮法！！快手产品运营一面和面试官聊了40min，我回答后她直接一整个大皱眉，但她非常耐心地跟我分享了很多干货，虽然把我拒了，但我真的非常感谢这位面试官😭从中获取对行业、岗位更深刻的认知，白嫖面试官的经验感悟！！以下是在一次次面试复盘中，关于产品运营的一些基础知识点，和牛油们共勉~1、首先要知道产品运营是什么👉一切连接用户与产品的手段都是产品运营，不需要给 “产品运营” 一个标准定义，实事求是、具体问题具体解决在 to C 领域，产品运营是指围绕获客、促活、留存、收益、推荐（AARRR 模型）展开的各类工作负责用户的拉...

查看8道真题和解析非技术面试记录

点赞评论收藏

分享

昨天 12:57

歌尔股份_信息技术支持(准入职员工)

歌尔股份内推歌尔股份面经

歌尔声学股份有限公司 硬件开发工程师 面经通过校园招聘收到的面试电话，通知我写一份网上性格测评，第二天进行现场一对一的面试，由于想在青岛进行研发，所以给我面试的是青岛硬件开发主管，首先给我看了PPT，介绍了主要工作内容和培训，然后问我会什么软件，对于PRO-E这些软件的使用情况，随后问了问家庭和学业情况。问题整理：1：是否学习过相关的软件2：对于pro-e有怎样的了解3：大学期间做的项目具体情况4：家庭情况（父母在哪里工作？他们支持你离开家乡工作吗？家里多少口人等）5：未来职业规划6：你还有什么问题想问的歌尔2025届校园招聘进行中【企业介绍】国家重点高新技术企业，主要从事声光电精密零组件及精...

点赞评论收藏

分享

02-19 20:11

门头沟学院产品经理

怎么选offer？

投票

各位大佬给点建议吧，孩子真的不知道该咋选了😭😭😭

点赞评论收藏

分享

01-10 10:41

南京大学 Java

吃泡面被mt以为吃不起饭了，要给我买鸡翅

#实习生活中那些难忘的瞬间# 在百度的时候mt总会喊我一块吃饭但有时候我不想跟他一块吃，因为食堂吃腻了所以有一天我溜了，买了桶泡面大学的时候经常吃泡面，特别上完体育课，冬天搁宿舍来一口非常爽好巧不巧窝在公司茶水间泡水的时候被mt看到了然后就有了图中的对话希望他们没有聊，组里有个实习生已经吃不起饭了感觉还是大家对泡面的观念不一样当然百度200一天的工资真的很少mt人确实挺好的，可惜之后我再也没回过上海了

蝴蝶飞出了潜水钟丿：让他买

百度公司福利 556人发布实习生活中那些难忘的瞬间

点赞评论收藏

分享

02-19 15:45

北京农业大学行政专员/助理

百度产品经理面经

📍面试公司：百度💻面试岗位：产品经理📚面试问题：约30分钟1、自我介绍2、简历深挖：讲讲你参与过的项目（重点说角色和贡献）3、如何在支付环节进行商品搭售4、具体怎么做，理由是什么5、实习中遇到的最大难题及克服方法6、优化一个现有产品功能，怎么做7、反问

查看6道真题和解析非技术面试记录

点赞评论收藏

分享

评论

2

3

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 面试被问第一学历差时该怎么回答 #

98037次浏览 615人参与

# 你见过最离谱的招聘要求是什么？ #

152147次浏览 954人参与

# 水滴春招 #

38078次浏览 598人参与

# 你的房租占工资的比例是多少？ #

18112次浏览 223人参与

# 你想留在一线还是回老家？ #

17694次浏览 284人参与

# 听劝，这个简历怎么改 #

25376次浏览 325人参与

# 顺丰求职进展汇总 #

41900次浏览 252人参与

# 互联网行业现在还值得去吗 #

2702次浏览 23人参与

# 嵌入式岗知多少 #

24316次浏览 289人参与

# 2025，我想...... #

28513次浏览 310人参与

# 机械人的offer怎么选 #

119734次浏览 629人参与

# 大学最后一个寒假，我想…… #

18647次浏览 205人参与

# 面试被问“你的缺点是什么?”怎么答 #

15790次浏览 286人参与

# 第一份工作应该选高薪还是热爱？ #

11925次浏览 122人参与

# 机械人，你在招聘流程中的企业有哪些？ #

21801次浏览 205人参与

# 入职第四天，心情怎么样 #

13676次浏览 110人参与

# 招银网络科技工作体验 #

16052次浏览 81人参与

# 牛友投递互助，不漏校招机会 #

233161次浏览 3245人参与

# 0offer是寒冬太冷还是我太菜 #

1044762次浏览 8695人参与

# 租房找室友 #

8888次浏览 57人参与

# 大城市找工作会更容易吗 #

5810次浏览 31人参与

牛客网
牛客企业服务