陌陌三面面经---大数据开发实习岗(已oc)
以下是我面试陌陌的大数据开发岗的面试题,没有笔试直接面试,一共三轮技术面。总得来看,陌陌的效率也是挺高的,然后我面试的感觉是二面偏难,面试官很厉害,会多种源码,所以有些问题会深挖。然后三面的时间比较短,面试官很温和,不会的直接说不会面试官会说没关系。
一面: 3.23 68min
1. CAS的底层实现
2. CMS
3. 虚拟内存
4. Hbase的二级索引的流程
5. shell : 对数据排序
6. NIO
7. 外部排序
8. TCP和UDP
9. TCP如何实现可靠
10. 编程
random()随机产生[0, 正无穷)范围的随机数,利用该方法产生生成[m,n]范围的随机数。
11. Spark的stage划分
12. Spark的shuffle机制
13. 为什么要根据宽依赖划分stage
14. HashMap的底层结构?HashMap进行put操作会涉及哪些操作(扩容和链表转红黑树) ?ConcurrentHashMap如何实现线程安全的? 分段锁和CAS的比较?
15. JVM有哪些关键字实现了可见性(volatile,Synchronized,final)
二面 3.26 50min
1. spark on yarn的运行流程
2. hbase的多版本是如何实现的?(面试官说是因为lsm树有这个功能)
3. spark的shuffle机制
4. rpc是如何实现的
5. actor system有哪些组件
6. 如何设计一个分布式系统
7. CAP
8. JVM内存模型
9. AQS
10. 垃圾回收算法
11. spark和其他组件(例如分布式缓存之类的)组合工作时,如何更好的调度?
12. 事务的隔离级别
13. 介绍spark的内存管理
14. 多线程和分布式系统的区别
15. 有哪些序列化框架,如何选择?
16. Hbase的rowkey设计
三面 4.1 30min
1. 介绍项目
2. Hbase的二级索引如何保证数据和索引是一致的
3. spark shuffle源码
4. spark中的广播变量和计数器
5. mysql中的视图
6. 僵尸进程、孤儿进程、守护进程
7. 系统得讲解下计算机网络(就是从五层协议栈的角度讲一下网络,每一层涉及哪些协议,功能之类的)
8. 拥塞避免算法
9. kafka中的partition数据的查找(每个partition下面有多个segment,先定位segment再找具体offset的数据)
10. 二叉树最坏的搜索时间复杂度是什么,是对应什么情况
11. 平衡的二叉树有哪些,比较一下(AVL和红黑树)
12. Hbase的rowkey设计
13. Spark on yarn的工作流程
14. 图数据结构的存储结构及适用场景(邻接表和邻接矩阵)
15. 进程的调度方式和比较
HR面 4.3 15min
对地点的要求,目前的手上的offer情况之类的,以后的工作方向等等
4.14 收到oc~
下面是一个分享实习面经或者交流的群,欢迎大家加入,一起聊聊找实习的事或者分享经验。