1. 说了一下项目 2. 简历里面哪个框架你最熟悉? 3. 谈一谈你对Hadoop的理解,基础架构及原理 4. 2NN的全称是什么?为什么需要2NN? 5. 如果没有2NN,只有DataNode,NameNode行不行? 6. MapReduce中有没有涉及到排序? 7. 说一下shuffle,为什么Map端输出的时候需要排序?不排序直接输出难道不好吗? 8. Container的启动过程了解吗,它是如何启动的? 9. Container如何限制磁盘的大小? 10. 搭建集群环境中遇到的最大的挑战是什么?解决之后有没有思考...