Keep大数据开发岗 面经 2022

笔试:
   1. 排序算法分析讲解 
   2. 如何query根据单独每个月的收入,得到每个月至今的累计收入(Hive的开窗函数,MySQL使用JOIN&WHERE self join)。

面试:

  1. Hadoop能够高性能吞吐的依赖有哪些?(HDFS, MapReduce)

  2. Hadoop的完整计算过程,包括Map,Reduce过程、任务调度等。

  3. 数据资源是怎么Partition的?是什么策略?(3 replicas)

  4. Spark常用哪个算子,讲一下原理?(RDD)

  5. Spark是依据怎么分stage的?什么是宽依赖、窄依赖?

  6. Hive除了Query还用过别的操作吗?

  7. 什么是数据倾斜问题,场景有哪些?常见的解决方法是什么?

建议:

  1. Hadoop, Spark自己动手搭建环境并且总结遇到的问题与解决方法。

  2. 各个框架各自的优缺点对比,应用场景是什么。

#Keep实习##面经##Keep##数据开发工程师#
全部评论
春招还是实习啊
点赞 回复 分享
发布于 2022-04-27 17:43
楼主面的咋样了?
点赞 回复 分享
发布于 2022-04-28 15:07
楼主,大数据做项目做的什么啊,找不到一个能做的项目,我找的项目都是没有虚拟机资料的,求分享
点赞 回复 分享
发布于 2022-05-16 21:32

相关推荐

11-26 22:34
已编辑
重庆邮电大学 Java
快手 客户端开发 (n+5)k*16 公积金12
牛客895077908号:佬 什么双非硕啊
点赞 评论 收藏
分享
整顿职场的柯基很威猛:这种不可怕,最可怕的是夹在一帮名校里的二本选手,人家才是最稳的。
点赞 评论 收藏
分享
评论
4
29
分享
牛客网
牛客企业服务