多益网络 大数据研发工程师面经
一面(约30min)视频面试
大致回忆记录了一下,菜鸡希望攒一拨人品😂
1、自我介绍
2、将项目展开来了解了一下,问了一些项目的细节,说说你在参与项目过程中遇到的困难(然后就顺着项目中用到的大数据组件开始提问)。
3、HBase rowkey的设计原则(三大原则)
4、HBase的“热点”问题了解吗
5、mapreduce的shuffle流程介绍一下
6、HDFS的读写流程大致说一下
7、Namenode和DataNode的工作机制
8、项目中用到了spark streaming,那spark算子了解吗,介绍一些常用的(分为Transformation算子和Action算子举了几个例子)
9、reduceByKey()和groupByKey()的区别
10、Linux常用的传输指令,随便介绍一个就行(就说了个scp指令)
11、Linux三剑客知道吗(awk,sed,grep)
12、MySQL底层索引了解吗(B+树),然后设计了一个情景,大概是有三组数据分别的需求是更新,查询,排序,那么这三组数据是否适合建立索引(表述可能不到位)。
13、MySQL在Innodb索引下B+树的最大高度是多少
技术问题就差不多到这,接下来就是问了一下平时假期都喜欢做些什么,加班问题怎么看,为什么想来广州,期望薪资是多少等等。
反问:问了一下公司现在使用的大数据技术栈。
面试整体过程基本是参照项目问的,应该比较基础了,但感觉答得一般(还是太弱了),攒一波人品吧。