hive统计五分钟内访问超过三次的用户

比如现在有一张表,id,e_time,分别代表用户的id和时间时间戳(精确到秒),使用hive统计出五分钟内访问超过三次的用户。例如:12:00:00-12:05:00是五分钟,12:00:01-12:05:01也是五分钟
全部评论
真实数据模拟
2 回复 分享
发布于 2022-03-29 10:50
select    id from ( select    id, round((unix_timestamp(e_time) - unix_timestamp(time_lag)) / 60,1) minute from    (select *,lag(e_time,5)over(parition by id order by e_time)time_lag from table)a where    round((unix_timestamp(e_time) - unix_timestamp(time_lag)) / 60,1)<=5 )b group by    id 1、子查询a是利用窗口滑动,来计算用户第N次的登录时间,time_lag取决于我要滑动几次,下面示例是滑动两次   id     e_time  time_lag 1 1name  1:00                          2 2name  1:01                           3 3name  1:02   1:00                        4 4name  1:03   1:01                        5 5name  1:04   1:02 2、子查询B是吧时间转成成面数以后做计算转成分钟 3、最后的查询是用来去重,因为一个用户5分钟如果要是登录的上百次,那么会统计出很多次符合规则的计算,所以去重
2 回复 分享
发布于 2022-03-29 10:48
不会
点赞 回复 分享
发布于 2021-12-12 23:00

相关推荐

面试官全程关摄像头1.自我介绍一下2.React和Vue哪个更熟悉一点3.你在之前那段实习经历中有没有什么技术性的突破(我只是实习了44天工作28天,我把我能说的都说了)4.你封装的哪个表单组件支不支持动态传值5.自己在实习阶段Vue3项目封装过hook吗6.hook有什么作用7.Vue2和Vue3的响应式区别(我说一个是proxy是拦截所有的底层操作,Object.defineProperty本身就是一个底层操作,有些东西拦截不了,比如数组的一些操作还有等等,面试官就说实在要拦截能不能拦截????我心想肯定不行呀,他的底层机制就不允许吧)8.pinia和vuex的区别(这个回答不出来是我太久没用了)9.pinia和zustand的区别,怎么选(直接给我干懵了)(我说react能用pinia吗&nbsp;&nbsp;他说要用的话也可以)10.渲染一万条数据,怎么解决页面卡顿问题(我说分页、监听滚轮动态加载,纯数据展示好像还可以用canvas画)(估计是没说虚拟表单,感觉不满意)11.type和interface的区别12.ts的泛型有哪些作用(我就说了一个结构相同但是类型不同的时候可以用,比如请求响应的接口,每次的data不同,这里能用一个泛型,他问我还有什么)13.你项目用的是React,如果让你再写一遍你会选择什么14.pnpm、npm、yarn的区别15.dependencies和devdependencies的区别总而言之太久没面试了,上一段实习的面试js问了很多。结果这次js一点没问,网络方面也没考,表现得很一般,但是知道自己的问题了&nbsp;&nbsp;好好准备,等待明天的影石360和周四的腾讯了&nbsp;&nbsp;加油!!!
解zj:大三的第一段面试居然是这样的结局
查看15道真题和解析
点赞 评论 收藏
分享
评论
1
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务