着陆页科技-数开实习面经

1. 自我介绍
2. java基础。equal和‘==’区别、&和&&区别、常用集合、list的实现类、list和set区别、继承特性、list和set区别。
3. 介绍一下hadoop,说一下上传数据的流程。
4. yarn的作用,资源调度过程。
5. mapreduce过程、shuffle过程。
6. hadoop高可用如何实现、通过什么方法调度、namenode挂一个怎么办、namenode重新上线后会怎么样。
7. 介绍一下Hbase、region作用,用什么管理region?
8. hive的作用和特点、hive中表的类型区别、hql转换成mapreduce过程、hive如何进行调优、hive中join操作类型。
9. zookeeper的作用、zookeeper如何实现分布式锁、选举机制、zookeeper集群监控方式。
10. kafka的作用、kafka如何保证消息顺序和一致性、介绍kafka中topic和partition、如何提高kafka的吞吐量。
11. flume的作用、如何保证数据的可靠传输。
12. 介绍spark、spark中数据处理模型、RDD的五大特性、RDD和DateFrame的区别、两者之间如何转换、介绍spark的核心组件、spark如何处理数据倾斜问题。
13. 机器学习和深度学习的区别、有监督学习和无监督学习的区别。
14. 问项目、项目中负责什么工作、亮点。

反问xxx

这个岗位主要是参与那种高校学习实验平台的建设、听面试官说主要负责一些实验教案的编写。
问的东西真的多,小组件的一些东西,我说不会说的我自己都想笑了
全部评论

相关推荐

4 3 评论
分享
牛客网
牛客企业服务