陌陌数据仓库一面面经
10月15号视频面试,首先是自我介绍,楼主说自己平常python用的比较多,所以面试官先问了一些python的问题:
说一下python的装饰器
说一下python的反射机制
说一下怎么用shell脚本取两个文件内容的交集(每一个文件有一列数据,Awk)
说一下数据库索引的几种类型
说一下索引的底层实现原理
说一下JAVA的内存管理机制(如果老年态发生了溢出,应该是什么问题【导入jar包过多】)
说一下ZOOKEEPER的分布式锁实现方式
如何解决数据倾斜问题(假设某一天的数据量比其他日期数据量大很多的情况)
如何实现并行导出大量分区数据
出了两道编程题:
- 多叉树 a[3, 3, 3, -1, 2]
数组中每个数代表此下标元素的父节点的下标,eg:第一个元素的下标值为3,所以第一个元素的父节点是a[3], -1 代表根节点
求该树的深度?
2. 文件(输入):
user1 user2 is_friend
user2 user1 is_friend
user1 user3 is_friend
user3 user1 is_friend
user4 user5 is_friend
user5 user4 is_friend
user2 user5 is_friend
user5 user2 is_friend
题目:使用sql或者MR求出共同好友列表
输出eg:
user1 user2 common_friend_list()
user1 user5 common_friend_list()
总时长约一个半小时(楼主在上面两道编程题花了很久),面试官很nice,最后被告知没有通过。。。
面试官给的一些建议
- 应届生在没有多少项目经验的时候只能考察基础知识,尤其是数据结构与算法,所以平时应该多想多敲算法题,提高自己的算法思维敏捷度和代码速度。
- 对于本科生而言,能进大公司,那么有充足的发展空间和时间,如果不能进大公司,那很大一方面靠机遇和自身的定位。
- 对于要不要读研来说,读研会提高你的视野,让你的理论和思想上升一个层次,但这并不是绝对的,得看你的能力和学校的水平,如果觉得自己的发展有瓶颈的时候可以选择读研