某公司-大数据开发-笔试题

两道sql
1. 分组top n
 课程id,学生id, 分数,求每个课程前两名的学生

2.最大连续收入天数

收入income, 用户 user_id , 日期 date_id, 给定30天的数据,求用户有输入的最大连续天数。

我理解错了,写成用户的最大的没有连续收入的天数
使用lead打标记

实际上使用sum() 开窗在分组就可以做了。

然后还有就是
五道选择题
1.存储过程, hdfs读写流程原理, python语法等

五道多选题
1. 数据分类标准
2. 数仓的一致性校验等

五道简答题
1.sql两道
3. spark数据倾斜
4.数据在数仓的生命周期,如何实现
5. 数据质量如何实现,具体说明

值得一提的是使用在线牛客网面试,限时
全部评论

相关推荐

03-15 11:21
南京大学 Java
ggoffer:第三题一个一个试,试出了9 10 11 23,加几个条件判断过了20%
投递美团等公司7个岗位
点赞 评论 收藏
分享
评论
2
16
分享

创作者周榜

更多
牛客网
牛客企业服务