首页 > Keep大数据开发岗面经 2022

牛客62161043号

发布于 2022-04-27 16:23

+ 关注

Keep大数据开发岗面经 2022

笔试：

1. 排序算法分析讲解

2. 如何query根据单独每个月的收入，得到每个月至今的累计收入（Hive的开窗函数，MySQL使用JOIN&WHERE self join）。

面试：

Hadoop能够高性能吞吐的依赖有哪些？（HDFS, MapReduce）
Hadoop的完整计算过程，包括Map,Reduce过程、任务调度等。
数据资源是怎么Partition的？是什么策略？（3 replicas）
Spark常用哪个算子，讲一下原理？（RDD）
Spark是依据怎么分stage的？什么是宽依赖、窄依赖？
Hive除了Query还用过别的操作吗？
什么是数据倾斜问题，场景有哪些？常见的解决方法是什么？

建议：

Hadoop, Spark自己动手搭建环境并且总结遇到的问题与解决方法。
各个框架各自的优缺点对比，应用场景是什么。

全部评论

(3) 回帖

加载中...

话题同步到我的动态回帖

扫一扫，把题目装进口袋

求职之前，先上牛客: 扫描二维码，进入QQ群



扫描二维码，关注牛客公众号

公司地址：北京市朝阳区北苑路北美国际商务中心K1座一层-北京牛客科技有限公司
联系方式：010-60728802 投诉举报电话：010-57596212（朝阳人力社保局）
牛客科技© All rights reserved admin@nowcoder.com
京ICP备14055008号-4 增值电信业务经营许可证营业执照人力资源服务许可证
京公网安备 11010502036488号