字节Data大数据3面+HR面,已意向书,感谢牛客
首先,感谢字节,不得不说字节的效率是真的高,每次面试HR的电话约面都很快,总共三面+HR面用了不到两个礼拜,这简直太良心了。
成不能成都能很快回复,不耽误应聘人的时间。
接下来,我一次性把三面加HR面的回顾都发出来,回馈一下牛客,再一次感谢大佬们的面经。
多说一句,面经虽然可以帮助了解应聘公司的大概面试深度,但,最好的面试准备大纲是自己的简历。
字节Data数据部门(北京) 大数据开发工程师
一面总结:
8.17 16:00
时长:1个小时42分钟
1.自我介绍
2.围绕竞赛的一个计算几何项目问(这个项目做了什么东西?落地的应用有哪些?)
3.围绕数仓项目问(数仓为什么分层?分几层?每一层都做些什么?ODS层和用户采集模块有什么异同?中间还穿插了很多包括Hive、Kafka、Flume、HDFS的知识点)
4.MySQL有什么引擎,有什么区别?
5.MySQL中char和varchar有什么区别?
6.详细说下数据库事务的特点
7.hadoop中的shuffle机制
8.聚簇索引了解吗?
9.回表了解吗?
10.Hash索引和B+Tree索引的区别
11.一个考察多表联立的简单SQL题
12.有什么优点?有什么缺点?
13.为什么想要来做大数据开发?
14.反问问题
时长:1个小时28分钟
时长:1个小时42分钟
1.自我介绍
2.围绕竞赛的一个计算几何项目问(这个项目做了什么东西?落地的应用有哪些?)
3.围绕数仓项目问(数仓为什么分层?分几层?每一层都做些什么?ODS层和用户采集模块有什么异同?中间还穿插了很多包括Hive、Kafka、Flume、HDFS的知识点)
4.MySQL有什么引擎,有什么区别?
5.MySQL中char和varchar有什么区别?
6.详细说下数据库事务的特点
7.hadoop中的shuffle机制
8.聚簇索引了解吗?
9.回表了解吗?
10.Hash索引和B+Tree索引的区别
11.一个考察多表联立的简单SQL题
12.有什么优点?有什么缺点?
13.为什么想要来做大数据开发?
14.反问问题
二面总结:
8.26 10:00 时长:1个小时28分钟
1.自我介绍
2.说出其中最有印象的项目或者比赛,为什么?裁剪项目中哪里用到动态规划思想?
3.快速排序时间复杂度是多少?什么情况会出现最差的结果?
4.数仓的数据采集工具使用的是什么框架?
5.Flume的source、channel、sink都采用的什么类型
6.Kafka中都有哪里会有选举过程,使用什么工具支持选举(ZooKeeper)
7.Kafka中如何保证数据一致性(从生产者、broker、消费者组三个部分都介绍下)
8.两个数仓的表有什么不同,两个数仓的数据如何共用(Sqoop从MySQL中导入数据到Hive(HDFS))
9.Hadoop任务的Yarn调度过程
10.本科毕业到研究生入学这期间做了什么?有什么收获?
11.路径规划论文和项目简单讲讲
12.谈谈职业规划
13.为什么数仓选择去做电商数仓?对数仓的认识(OLAP、OLTP),有没有兴趣做数仓
14.用过抖音、西瓜视频、火山小视频或者B站么?如果你是决策层,你会关注哪些指标?
15.网站中搜索www.baidu.com这背后的全过程
16.Http状态码403、304、502分别是什么?
17.手撕代码:求字符串的最长回文子序列(不是长度,第一次没听清,用二维dp求出了长度,后来在面试官提醒简单修改了下..尴尬)
18.抗压能力如何?平常如何解压?
19.反问问题
三面总结:
8.27 15:00
时长:41分钟
1.没让自我介绍,直接问学校实验室研究方向是什么?为什么来做大数据?来做数仓?
2.说下简历中提到的这些大数据框架的学习路径,都是解决什么问题(问题看起来简单,其实坑很多..)
3. 最近在看什么技术类的书?之前都看过什么技术类的书?
4. 平常用什么途径来获取新技术和知识?
5.你觉得字节跳动、阿里这种大互联网公司的收入和支出都在什么地方?
6.《计算广告》这本书哪个部分印象比较深刻?CPC和CPM了解吗?
7.了解西瓜视频或者B站的商业模式或者Up主管理吗?知道作者运营这个岗位吗?如何发掘出有潜力的Up主(考虑什么数据指标发掘潜力Up主)
8.《数学之美》里印象深刻部分是什么?用户画像了解吧?现在让你快速定位出大学生用户,会选用什么数据指标?
9.平常用字节跳动的什么App?这个App你觉得和同类型App相比优势和劣势在哪儿?
10.反问问题
总结:
1.面试官特别忙,面试前临时说稍等,一直开会到15:30才开始,面到一半电脑没电了在出差改打电话了。越是这种情况我们越不要慌,也别催面试官.. 稳住
2.面试官后来也说了,之前的面试官说你有业务角度的理解,今天问题有点像面产品经理,但其实在数据岗位,工程能力、数仓建模和业务意识同等重要,要迎合业界技术趋势,不用过时技术。
时长:41分钟
1.没让自我介绍,直接问学校实验室研究方向是什么?为什么来做大数据?来做数仓?
2.说下简历中提到的这些大数据框架的学习路径,都是解决什么问题(问题看起来简单,其实坑很多..)
3. 最近在看什么技术类的书?之前都看过什么技术类的书?
4. 平常用什么途径来获取新技术和知识?
5.你觉得字节跳动、阿里这种大互联网公司的收入和支出都在什么地方?
6.《计算广告》这本书哪个部分印象比较深刻?CPC和CPM了解吗?
7.了解西瓜视频或者B站的商业模式或者Up主管理吗?知道作者运营这个岗位吗?如何发掘出有潜力的Up主(考虑什么数据指标发掘潜力Up主)
8.《数学之美》里印象深刻部分是什么?用户画像了解吧?现在让你快速定位出大学生用户,会选用什么数据指标?
9.平常用字节跳动的什么App?这个App你觉得和同类型App相比优势和劣势在哪儿?
10.反问问题
总结:
1.面试官特别忙,面试前临时说稍等,一直开会到15:30才开始,面到一半电脑没电了在出差改打电话了。越是这种情况我们越不要慌,也别催面试官.. 稳住
2.面试官后来也说了,之前的面试官说你有业务角度的理解,今天问题有点像面产品经理,但其实在数据岗位,工程能力、数仓建模和业务意识同等重要,要迎合业界技术趋势,不用过时技术。
所以无论面试什么岗位时,除了技术层面,尽量多透露出在业务层面的思考。
HR面总结:
8.27 16:40
时间:20分钟左右
HR面总结:
8.27 16:40
时间:20分钟左右
1.喜欢旅游?都去过哪儿?
2.对成都这个城市印象怎么样?和南京、北京这些城市有什么不同?
3.喜欢踢球和跑步,频次如何?
4.个人有哪些优缺点?
5.遇到的最大挫折是什么?如何跨越过去的?
6.怎么看待天赋和努力的关系
7.平常用过字节跳动什么App
8.为什么选择应聘字节跳动?这几次面试体验如何?
9.现在都有什么公司的offer了?能不能具体说明
10.将来工作base选择哪里?字节给你offer会不会来?
11.反问问题
9.4
意向书邮件
================================= 分隔线 ===================================================
我再把抖音的提前批一面总结也放出来吧,那次面的很差,不是自己的节奏,就挂了,后来被data部门捞了,再次感谢data。
2020.07.26 16:00
抖音 大数据开发工程师一面
时长:一个小时
面试方式:视频面
1.自我介绍
2.编程题:
一遍MapReduce实现矩阵乘法A*B,map端输入数据格式是(矩阵名(A或B),行号,列号,值)。A:m*n B:n*k。
行数和列数非常大,数据按行输入。
抖音 大数据开发工程师一面
时长:一个小时
面试方式:视频面
1.自我介绍
2.编程题:
一遍MapReduce实现矩阵乘法A*B,map端输入数据格式是(矩阵名(A或B),行号,列号,值)。A:m*n B:n*k。
行数和列数非常大,数据按行输入。
3.RDD的宽窄依赖和stage划分过程
4.Hadoop中shuffle的详细过程
5.Hive避免数据倾斜有哪些优化手段
6.之前接触过哪些数据库,redis? Hbase? MySQL?MySQL数据库引擎的一连串问题
7.Hive中分桶技术
8.操作系统中进程和线程的定义和区别
9.简述局部性原理内容和计算机领域的应用
10.进程间通信的方式有哪些
最主要收获:编程题和leetcode与剑指offer的风格不太一样,需要多关注大数据方向的编程题和常见思维模式
其次:计算机基础内容知道关键点即可,答出关键点就下一题了。但是方向技术栈要非常熟悉,另外编程题很重要。
#秋招##面经##校招##字节跳动##大数据开发工程师#4.Hadoop中shuffle的详细过程
5.Hive避免数据倾斜有哪些优化手段
6.之前接触过哪些数据库,redis? Hbase? MySQL?MySQL数据库引擎的一连串问题
7.Hive中分桶技术
8.操作系统中进程和线程的定义和区别
9.简述局部性原理内容和计算机领域的应用
10.进程间通信的方式有哪些
最主要收获:编程题和leetcode与剑指offer的风格不太一样,需要多关注大数据方向的编程题和常见思维模式
其次:计算机基础内容知道关键点即可,答出关键点就下一题了。但是方向技术栈要非常熟悉,另外编程题很重要。