字节跳动大数据开发工程师和小鹏汽车凉经
都收到感谢信了。
一面:
抽象类与接口
多态
四种引用说一说 强引用 软引用 弱引用 虚引用
集合相关(HashMap一点没问。。。)
锁 并发咋处理,
进程与线程的区别
写了归并排序
presto和kylin区别(项目中用到了,问了)
shuffle机制 mr和spark的shuffle
kafka副本机制
zookeeper选举(Paxos 算法) 这个不了解,只知道有这个东西
二面(7.26)
个人介绍,上来先聊了聊本科和研究生的课程(数据分析,机器学习,数据仓库与数据挖掘,人工智能),本科双非末流二本,不是正经的科班(计算机相关专业),没学过计算机网络和操作系统的课程,感觉面试官想问。
JVM虚拟机,为什么需要虚拟机
内存区域,五部分
栈和堆区别,具体存放的东西?
String在哪里?字符串池或者内存中新开辟(应该是这样)
线程在哪里?(是不是堆中?)
锁的相关;sync,lock类;详细介绍一下
线程遇到过什么坑?我说没用过太多,然后就说死锁问题?四个条件
ArrayList和LinkedList区别?底层实现?两者扩容机制
聊了项目,问了项目具体分析的指标(实习的数仓项目),
数仓分层
Kylin的Cube构建,优化一些策略(项目中用过,写了,所以问了)
Spark在项目中有没有用过?
算子,四种算子,问了cache()算子;广播变量介绍一下,什么场景下用广播变量;问了广播变量和cache区别(懵逼状态)
Hive的优化策略,分区,分桶(进一步追问了,了解太少)
到半小时了,就写代码了,面试官指导一下,也不太会,太懒了,没刷过题
题目是:两个有序数组间相加和的Topk问题,一搜就有了
小鹏(7.27)
上来先问能不能实习,我说不是秋招,一定要吗?我说不一定,其中一个面试官苦笑了,而且好像实习明年能不能转正还另一说
问了实习项目数据量情况
问了简历上写的数学建模问题
Yarn调度和AppMaster作用
Kafka干啥,高吞吐的原因
他说了分组情况,(数据平台,数仓,用户画像数据挖掘),问想做啥?
总共聊了20分钟,感觉我说了不一定能实习,他俩就没兴趣了
问了实习项目数据量情况
问了简历上写的数学建模问题
Yarn调度和AppMaster作用
Kafka干啥,高吞吐的原因
他说了分组情况,(数据平台,数仓,用户画像数据挖掘),问想做啥?
总共聊了20分钟,感觉我说了不一定能实习,他俩就没兴趣了