米哈游大数据视频一面面经
米哈游
问的内容还挺细的,记录一下给大家提供一下面经,攒一下人品。
一面:
1、自我介绍
2、你这些实习好像都很短啊,原因是什么?
3、讲一下华为实习的内容吧。
4、Spark的宽窄依赖了解么?
5、Spark中的RDD、dataFrame、dataSet的区别?
6、Spark中的map和flatMap的区别是什么?
7、Spark中的groupByKey、reduceByKey、aggregateByKey的区别?
8、一个完整的MapReduce整个有哪些过程?这些过程中哪些会用到排序呢?
9、Hadoop里面的SecondaryNameNode的作用是什么?具体恢复过程了解么?
10、Hive里面的join分哪些类型呢?Hive的join的优化一般会怎么优化?除了mapjoin还知道别的么?
11、kafka接触过吗?实时计算的Spark Streaming、Flink了解过吗?
12、数仓分层一般分为哪几层?数仓建模时用到的雪花模型和星型模型的区别?
13、主要开发语言是什么?
14、讲一下JVM的内存模型吧。
15、常用的GC算法有哪些?怎么判断一个对象是否可以被回收?分代内存回收了解么?年轻代的继续划分?如果我要分配一个对象,这个对象已经超过了eden区的大小,这时会发生什么情况?
16、常用的垃圾收集器,CMS和G1了解吗?
17、Java的双亲委派模型了解么?
18、Java里面支持多继承么?接口和抽象类的区别是什么?
19、HashMap和ConcurrentHashMap的区别是什么?ConcurrentHashMap具体是怎么实现线程安全的,了解么?HashMap底层的数据结构了解么?二叉搜索树和平衡二叉树有什么区别?如何将一个二叉搜索树变成一个平衡二叉树?
20、常用八大排序算法的时间复杂度?堆排序的时间复杂度是多少?建堆的时间复杂度?堆调整的时间复杂度?哪些排序是稳定的,哪些排序是不稳定的?如果一个数组是基本有序的,那我们要用什么排序会比较好?假设我们要对某个公司所有员工的年龄进行排序,这个时候用什么排序算法比较好?
21、怎么判断两个链表是否相交?怎么优化?
22、TCP和UDP的区别是什么?
23、HTTP和HTTPS有什么区别?
24、子网掩码有什么用?
25、进程和线程的区别?进程间通信的方式?
26、什么是死锁,死锁产生的必要条件有哪些?
27、数据库的事务?事务的特性?分别指的是什么含义?
28、数据库的索引,比如MySQL的索引有了解么?B树和B+树有什么区别?聚簇索引和稀疏索引的区别?
29、MySQL的两个引擎InnoDB和MyISAM的区别是什么?
30、memchache和redis有了解过吗?
31、一致性Hash有了解过吗?
32、linux常用的命令,我们要看操作系统中有哪些进程,用什么命令?如果看端口被哪些程序占用了,用什么看?
33、常用的vim命令,如何跳到第一行?怎么跳到最后一行?如何删除一行?
34、sed和awk用过么,用这两个实现把一个文件中的空行进行删除。
35、正则表达式中的贪婪匹配和非贪婪匹配了解吗?这个具体写的时候怎么写了解么?
36、常用的版本控制软件,git reset和rebase的区别是什么?