蚂蚁面试
一面(70min)
1.自我介绍
2.问我自我介绍里说的数仓项目,就问了两个问题,没问简历的项目
3.八股
- 说说HashMap为啥线程不安全(只记得死循环了,面试官还安慰我记不住没事,我太菜了真的对不起
)
- HashMap怎么解决hash冲突的(回答到key相同的时候,数据放哪里就不知道了)
- 线程与进程的区别
4.大数据
- 说说MapReduce的shuffle过程(问的深,分区为啥要排序,reduce数量怎么算出来的)
- MapReduce是运行在进程还是线程上(这个我真不知道,我回答的进程)
- 运行在进程上有什么好处与坏处(蒙,我说便于资源调度,但是任务多了会占用过多资源影响效率)
- 你认为MapReduce运行在线程好还是进程好(我说的进程,解释:Hadoop有资源调度框架,能够高效分配资源
)
- 说说怎么解决数据倾斜
- 如果倾斜原因是因为某些数据重复过多,该怎么解决(我说的是加随机数打散)
- 那打散后怎么处理(我说join,然后就没问了,不知道是不是回答错了)
- 有没有别的方法(想不出来了
)
- Hive和MapReduce有什么联系(我没太理解什么意思,我只说了Hive能将HQL转为MapReduce,然后能构建数仓)
- map与reduce的并行度怎么确定的(不是task数量)
- 问了一下SQL优化(简历有写,但是没想起来,崩溃,给自己挖坑)
5.笔试(因为我是直接从简历跳到面试,面试官说笔试环节必须要有)
一道SQL
快速排序(出这题我感觉我要凉了,估计为了安慰我受伤的心
)
6.有什么问题(问了一下这个职位进去都是干啥工作的,面试官说他们这个部门是做实时的,flink(哦豁完蛋
),然后又说了不同企业招的数开职责都不一样,有的写引擎,有的搞底层,有的搞数仓,反正说了很多,然后就结束了)
这个面试官真好,一直安慰我,我跟他说我是第一次面试,他说话就像把我当学生
#数据人的面试交流地##你已经投递多少份简历了##我的实习求职记录##面经##蚂蚁2024暑期实习#