某公司-大数据开发-笔试题
两道sql
1. 分组top n
课程id,学生id, 分数,求每个课程前两名的学生
2.最大连续收入天数
收入income, 用户 user_id , 日期 date_id, 给定30天的数据,求用户有输入的最大连续天数。
我理解错了,写成用户的最大的没有连续收入的天数
使用lead打标记
实际上使用sum() 开窗在分组就可以做了。
然后还有就是
五道选择题
1.存储过程, hdfs读写流程原理, python语法等
五道多选题
1. 数据分类标准
2. 数仓的一致性校验等
五道简答题
1.sql两道
3. spark数据倾斜
4.数据在数仓的生命周期,如何实现
5. 数据质量如何实现,具体说明
值得一提的是使用在线牛客网面试,限时
1. 分组top n
课程id,学生id, 分数,求每个课程前两名的学生
2.最大连续收入天数
收入income, 用户 user_id , 日期 date_id, 给定30天的数据,求用户有输入的最大连续天数。
我理解错了,写成用户的最大的没有连续收入的天数
使用lead打标记
实际上使用sum() 开窗在分组就可以做了。
然后还有就是
五道选择题
1.存储过程, hdfs读写流程原理, python语法等
五道多选题
1. 数据分类标准
2. 数仓的一致性校验等
五道简答题
1.sql两道
3. spark数据倾斜
4.数据在数仓的生命周期,如何实现
5. 数据质量如何实现,具体说明
值得一提的是使用在线牛客网面试,限时
全部评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享