网易大数据开发实习面经(已offer)
今天网易云终于发了offer,一定要来牛客还愿,大三菜鸡找实习真的太难了,非常感谢牛客上的大佬们的帮助,每天都是靠牛客坚持下来的!回报牛客,写一篇面经吧(真的有点久,记得不是很清楚,还好之前做了一些复盘)
3.21简历投递 3.27笔试 4.8一面 4.14二面 4.20HR面 4.29offer
一面:(35min)
1、项目介绍(自己做的一个数据预测+挖掘的项目)
2、项目中遇到的困难
3、Hadoop有的解(介绍一下Hadoop,简单说了一下Hadoop的组成和定义)
4、介绍一下MR的原理(工作流程,Map-Shuffle-Reduce)
5、Hive介绍一下(这里有点懵,因为感觉hive关键点在SQL,只说了Hive的定义和架构组成和一些底层MR、Tez、Spark的引擎的东西)
6、面试官说大数据分:数据产品(算法)、数据平台(服务端开发)、数仓(业务)三个方向,偏向于哪一个
反问:
技术栈,Spark还是Flink
对我的建议
二面:(40min)
1、介绍项目
2、项目中的困难(一面之后提前准备了这个)
3、重新开始,能够怎么去优化项目(从硬件设备、算法架构、人员配置、团队分工几个方面说了一下)
4、Hadoop的使用经验(介绍了一下Hadoop的生态和组成以及应用场景)
5、Hadoop使用中遇到的困难(从自身设备、内存分配、组件核心配置说了几点,重点说了数据倾斜)
6、Hadoop数据倾斜的解决方案(combiner、局部聚合加全局聚合、自定义分区、增加jvm内存)
7、HiveSQL数据倾斜和Spark数据倾斜(因为那时候还没学到spark,hive也不是很熟悉,就按照操作经验随便说了几点hive的)
8、个人对于算法研究的认知(因为项目里是偏算法的,但是我个人不喜欢做算法就分析了个人性格和实际的能力,以及对于学术研究的态度)
9、对于数仓的看法(之前做过尚硅谷的阿里云的离线数仓,按照那个数仓的架构体系说了一下)
反问:
更看重实习生哪方面的素质
网易数仓的整体架构
HR面:(45min)
1、自我介绍(一面二面也有,但是没写hhh)
2、家庭情况
3、学习习惯
4、项目介绍(因为是hr所以没怎么说技术,简单说了一下大概过程)
5、评价自己
6、offer情况
7、实习时间