hive统计五分钟内访问超过三次的用户

比如现在有一张表,id,e_time,分别代表用户的id和时间时间戳(精确到秒),使用hive统计出五分钟内访问超过三次的用户。例如:12:00:00-12:05:00是五分钟,12:00:01-12:05:01也是五分钟
全部评论
select    id from ( select    id, round((unix_timestamp(e_time) - unix_timestamp(time_lag)) / 60,1) minute from    (select *,lag(e_time,5)over(parition by id order by e_time)time_lag from table)a where    round((unix_timestamp(e_time) - unix_timestamp(time_lag)) / 60,1)<=5 )b group by    id 1、子查询a是利用窗口滑动,来计算用户第N次的登录时间,time_lag取决于我要滑动几次,下面示例是滑动两次   id     e_time  time_lag 1 1name  1:00                          2 2name  1:01                           3 3name  1:02   1:00                        4 4name  1:03   1:01                        5 5name  1:04   1:02 2、子查询B是吧时间转成成面数以后做计算转成分钟 3、最后的查询是用来去重,因为一个用户5分钟如果要是登录的上百次,那么会统计出很多次符合规则的计算,所以去重
2 回复 分享
发布于 2022-03-29 10:48
真实数据模拟
2 回复 分享
发布于 2022-03-29 10:50
不会
点赞 回复 分享
发布于 2021-12-12 23:00

相关推荐

2024-12-29 11:08
湖南工业大学 Java
程序员牛肉:简历没什么大问题了。 而且不要再换项目了。三月份就开暑期实习了,现在都一月份了。实在来不及重新开一下项目了。把一个项目写完或许很快,但是把一个项目搞懂吃透并不简单。所以不要换项目了,把你简历上面的两个项目好好挖一挖吧。 具体 体现在:你能不能流利的说出你的项目的每一个功能点代码实现?你能不能说出在这块除了A技术之外,还有其他技术能够实现嘛?如果有其他技术能够实现,那你这块为什么选择了你当前用的这个技术?
投递牛客等公司10个岗位
点赞 评论 收藏
分享
2024-12-30 22:49
长沙理工大学 Java
神哥了不得:没什么可以指导的地方了,简历确实牛,我大号分享过投递策略,广投就行
点赞 评论 收藏
分享
评论
1
3
分享

创作者周榜

更多
牛客网
牛客企业服务