hive统计五分钟内访问超过三次的用户

比如现在有一张表,id,e_time,分别代表用户的id和时间时间戳(精确到秒),使用hive统计出五分钟内访问超过三次的用户。例如:12:00:00-12:05:00是五分钟,12:00:01-12:05:01也是五分钟
全部评论
select    id from ( select    id, round((unix_timestamp(e_time) - unix_timestamp(time_lag)) / 60,1) minute from    (select *,lag(e_time,5)over(parition by id order by e_time)time_lag from table)a where    round((unix_timestamp(e_time) - unix_timestamp(time_lag)) / 60,1)<=5 )b group by    id 1、子查询a是利用窗口滑动,来计算用户第N次的登录时间,time_lag取决于我要滑动几次,下面示例是滑动两次   id     e_time  time_lag 1 1name  1:00                          2 2name  1:01                           3 3name  1:02   1:00                        4 4name  1:03   1:01                        5 5name  1:04   1:02 2、子查询B是吧时间转成成面数以后做计算转成分钟 3、最后的查询是用来去重,因为一个用户5分钟如果要是登录的上百次,那么会统计出很多次符合规则的计算,所以去重
2 回复 分享
发布于 2022-03-29 10:48
真实数据模拟
2 回复 分享
发布于 2022-03-29 10:50
不会
点赞 回复 分享
发布于 2021-12-12 23:00

相关推荐

喜欢吃蛋糕仰泳鲈鱼是我的神:字节可以找个hr 给你挂了,再放池子捞
点赞 评论 收藏
分享
Yushuu:你的确很厉害,但是有一个小问题:谁问你了?我的意思是,谁在意?我告诉你,根本没人问你,在我们之中0人问了你,我把所有问你的人都请来 party 了,到场人数是0个人,誰问你了?WHO ASKED?谁问汝矣?誰があなたに聞きましたか?누가 물어봤어?我爬上了珠穆朗玛峰也没找到谁问你了,我刚刚潜入了世界上最大的射电望远镜也没开到那个问你的人的盒,在找到谁问你之前我连癌症的解药都发明了出来,我开了最大距离渲染也没找到谁问你了我活在这个被辐射蹂躏了多年的破碎世界的坟墓里目睹全球核战争把人类文明毁灭也没见到谁问你了😆
点赞 评论 收藏
分享
1 3 评论
分享
牛客网
牛客企业服务