时长40分钟左右,总体问的东西不难(感觉是简历上没东西可问的)。今天面两场有点晕,这个面经只能是记得多少写多少了。1. 自我介绍2. 你的项目是学习的时候做的吗3. 你提到数据仓库分层,分别讲讲每层的作用4. 你提到DWS层存储一些指标,这个层可以删掉吗5. 讲讲HDFS(说了组件构成和读写流程)6. secondary nn起到什么作用(这里是我讲hdfs的时候,脑子抽抽忘说了,面试官点了一下)7. 讲一下mapreduce的流程8. 你提到shuffle过程中的排序,那在mr的shuffle中都有哪些排序9. 数据倾斜在什么情况下发生,如何解决10. java面向对象特性11. hive中的分区和分桶有什么区别12. hive的内部表和外部表的区别13. 说说udf udaf udtf14. 研究生阶段印象比较深的课程15. 撕两道sql(第一个考察left join、right join、inner join),第二个窗口函数16. 面试官顺势问了row_number() rank() dense_rank()的区别17. 反问中间问java,面试官应该是看出来我没怎么学java的八股内容,就没怎么追问java内容了。写sql的时候,因为不能编译运行,脑子想了半天,感觉写的有点慢了,还是得多练。#数据仓库实习生##字节暑期实习##大数据开发#