美团大数据开发实习

一面——60mins
自我介绍
拉链表的制作,数据量有多少,为什么不用快照表呢
项目有哪些表
数仓分层有哪些,具体做了什么,数仓分层作用
怎么设计表,怎么建模,DIM
DWD层的主题分了哪些
如何做的可视化
什么是数据倾斜,数据倾斜的解决方案
Hadoop和spark的区别
Spark的shuffle流程是怎么样的
对哪些数据库了解
Shuffle有哪几种类型
在shuffle的过程中会进行排序吗,有哪几种排序
什么是快速排序,时间复杂度是多少,手撕快排代码题
Spark是如何划分stage阶段
Spark SQL的执行流程,如何将一个SQL语句转换为任务
宽窄依赖,宽依赖阶段会发生什么
两个SQL题
反问
全部评论
面的哪个地方的岗位
1 回复 分享
发布于 2024-04-29 17:30 四川
你好,是什么部门呀,SQL用的hive吗
点赞 回复 分享
发布于 2024-04-25 21:02 山西
问一下大佬,sql题大概是什么呀
点赞 回复 分享
发布于 2024-04-25 21:34 北京
佬是已经oc了吗
点赞 回复 分享
发布于 2024-04-27 02:32 北京
你好,请问你的项目是之前实习做的吗?
点赞 回复 分享
发布于 2024-05-04 22:20 陕西
点赞 回复 分享
发布于 2024-06-03 16:51 上海

相关推荐

1.  简单介绍一下项目2.  在中间层建设中遇到过什么问题3.  数仓中状态的更新是比较及时的,如何记录这些状态,最核心是关心最终的状态还是流转的状态4.  拉链表是什么,怎么实现的,执行过程中怎么解决效率的问题5.  用的什么计算引擎,sql在spark上怎么执行的6.  spark的提交流程7.  uv和pv的含义,计算uv在spark上的运行原理8.  MapReduce的原理,快排的目的是什么,有序的目的是什么,知道每个过程才能知道如何去调优9.  sql转ast是怎么转的10. ast做逻辑执行计划优化做了哪些11. 逻辑执行计划和物理执行计划大概有什么区别12. 写sql过程中有没有遇到过执行时间特别长的,引出数据倾斜相关内容(问的很细,基本所有的都问了)13. 不同数据类型join为什么导致数据倾斜14. mapjoin和正常join的区别,mapjoin原理是什么,怎么实现的15. 加随机数打散,两阶段聚合怎么做的16. new一个线程怎么做,thread和runnable的区别是什么17. java集合类用过哪些(说没怎么用过java,就没再问了)18. sql在不同执行引擎下有什么区别,答有些语法不通用,为什么不通用,如何造成这种问题的19. sql中所有关键字的执行顺序20. a join b where条件写在join里面和join外面 有什么区别21. 4道sql22. 一道mid算法做的是计算引擎调优,一直在问spark底层,顶不住顶不住。当晚挂...
查看20道真题和解析
点赞 评论 收藏
分享
查看53道真题和解析
点赞 评论 收藏
分享
评论
10
70
分享

创作者周榜

更多
牛客网
牛客企业服务