2021春招经验贴 大数据开发 阿里字节小米

笔者杭电信管大三,妹子一枚,一年多的大数据学习经历,两份相关实习经验(数据分析和数据仓库),三月份开始投递简历,经历了小米两轮技术面、阿里测评+笔试+两轮技术面、字节三轮技术面,面试都比较顺利全部通过,4.8拿到了字节商业化广告大数据开发实习offer(小米岗位方向不符,阿里补笔试太难挂了)



本篇分享不按照公司或者时间顺序罗列面试题,按照知识点分块汇总,之前面网易、好未来遇到的知识点我也会加进去,另外面试中没遇到但我觉得很重要的点也会补充。

目录君来了

Hadoop
1、介绍下Hadoop(字节、好未来)
2、mapreduce处理流程/shuffle过程(阿里、好未来、网易)
3、Yarn是怎么工作的(小米)
4、mapreduce和hdfs是一体的吗,有什么关系(阿里)
5、数据倾斜是如何产生的及解决方案(阿里、字节、小米、网易、好未来)
6、mapreduce有几种join(字节)
7、Hadoop的HA


Hive
1、内部表和外部表的区别(字节、好未来)
2、数据仓库的分层(小米、好未来、网易)
3、星型模型和雪花模型的选择(字节、好未来)
4、数据仓库和传统数据库的区别(好多都问了)
5、接上问,维度冗余及三范式(字节、好未来)
6、hive数据存储格式、压缩格式,区别(好未来)
7、HQL执行慢是怎么解决的(字节、阿里、小米)


Spark
1、job、stage、task的关系(小米)
2、spark任务提交过程(阿里、小米)
3、spark常见算子(小米)
4、spark shuffle和mr shuffle的区别及优化
5、spark容错机制(阿里)
6、sparkSQL的几种join实现
7、介绍下sparkstreaming
8、spark RDD的理解


Flink
1、spark streaming和flink的比较(小米)
2、flink的状态(小米)
3、flink的容错机制、状态一致性(阿里)
4、讲述一致性检查点的实现——分布式快照(阿里)
5、flink的watermark、窗口机制、时间(小米)
6、flink的运行构架


Mysql
1、索引相关,b+tree(阿里)
2、建立索引的考虑因素(使用频率、联合索引、索引顺序)
3、聚簇索引、覆盖索引与回表查询
4、索引失效的情况,如何知道索引是否被用到
5、什么是事务,事务并发带来的问题(脏读、不可重复读、幻读)
6、ACID、隔离级别


Kafka
1、kafka的文件存储机制
2、kafka的可靠性保障
1)生产者往broker发送消息(副本数据同步策略、ISR、ACK)
2)topic分区副本
3)leader选举
3、kafka一致性保障
4、如何保障数据有序性
5、kafka和传统消息队列的区别


Redis
1、redis的优缺点
2、redis的数据类型
3、为什么redis效率高
4、redis主从复制过程
5、AOF、RDB的优缺点、适用场景
6、redis的过期淘汰策略
7、缓存雪崩、缓存击穿及如何解决(这部分我只了解概念...)


java
这个写起来就太多了,我每次面试前会把javase、多线程、jvm的重点串一遍
笔者java也是处于有待深入的阶段,后端开发的大佬可以看这篇


开放型问题
1、谈谈对大数据处理思想的理解(可以围绕分而治之、计算向数据移动展开)
2、谈谈对大数据体系演变的理解(阿里)
3、你觉得未来大数据体系的变化可能是怎样的(阿里)
4、如果你的抖音突然卡住了,会是因为什么(字节)


SQL题
遇到非常多道sql题,基本都跑不了开窗函数,有时候也遇到需要case when表达式转化的


算法
笔者不是算法大神,剑指offer刷过两遍,整体回顾过四五次,建议每次面试前将j剑指offer链表、二叉树、栈和队列、动态规划、递归及回溯的题目都分块回顾一次,链表的题一般用虚拟头结点、步长差解决。二叉树的题目一般要么和遍历有关,借助栈和队列,比如镜像和对称二叉树、求深度、之字形打印...都相当于在遍历中加入判断条件;要么用递归及回溯思想解决,比如树的子结构,最低公共祖先、和为某值的路径等题目。动态规划思想我认为是维护一个状态,关注点就在目前状态和新进来的数据上面,然后进行比较和状态更新,需要多练习找感觉。另外排序算法也要熟悉,冒泡啥的不说了,快速排序、归并排序也要可以直接写出来。算法练习过程中注意思考多种方法解题,字节面试中有遇到追问第二种方法解决问题。


非科班同学转型大数据可以看下b站TALKDATA的视频,有比较详细的学习路线


如有问题或者建议可以联系我,祝大家拿到理想offer~






#面经##校招##数据开发工程师##阿里巴巴##小米##字节跳动##网易#
全部评论
大三这么厉害了
2 回复 分享
发布于 2021-04-15 18:51
楼主好强,沾沾喜气。我投了好几个月的字节,今天终于给我发笔试通知了。
1 回复 分享
发布于 2021-04-15 23:15
您好,请问非科班研究生 想转大数据开发大约需要多长时间?现在学能否赶得上今年秋招
点赞 回复 分享
发布于 2023-02-16 17:26 广东
博主,sql题平常联系在哪能找到?
点赞 回复 分享
发布于 2022-03-29 15:09
请问下,“图”这种数据结构和算法考的多吗?感觉“图”好难啊
点赞 回复 分享
发布于 2021-09-29 12:14
大数据开发做什么呀只写sql吗
点赞 回复 分享
发布于 2021-06-17 06:35
方便加一下微信嘛 想聊聊你的实习诶
点赞 回复 分享
发布于 2021-06-15 11:19
楼主你的两次实习是日常实习嘛
点赞 回复 分享
发布于 2021-06-15 11:18
牛批啊大佬
点赞 回复 分享
发布于 2021-06-13 21:45
tql
点赞 回复 分享
发布于 2021-06-08 13:44
你好呀,你是重复刷了剑指吗?力扣其他题目需要重复刷吗
点赞 回复 分享
发布于 2021-06-08 08:34
想问一下楼主入职了吗,同时商业化广告北京岗,不过是后台开发
点赞 回复 分享
发布于 2021-05-25 19:45
大三俩次实习经验就离谱,大二上学期就开始实习了,大佬抱抱我
点赞 回复 分享
发布于 2021-05-24 15:37
诶楼主是大三学生嘛?那投的都是暑假实习?
点赞 回复 分享
发布于 2021-05-12 15:29
你好。小白想问一下往大数据发展的话,刷剑指offer的刷哪种语言会比较好呀?大数据岗会对哪些语言有要求呀?
点赞 回复 分享
发布于 2021-04-28 20:18
你好!想问下小米最后给的是什么岗位呀?base北京还是武汉呢
点赞 回复 分享
发布于 2021-04-27 21:00
太强了
点赞 回复 分享
发布于 2021-04-22 14:55
所以tql什么意思
点赞 回复 分享
发布于 2021-04-21 18:17
小姐姐项目方面怎么准备的
点赞 回复 分享
发布于 2021-04-17 23:02
还是妹子 太厉害了
点赞 回复 分享
发布于 2021-04-17 22:20

相关推荐

2025-11-08 21:43
济南大学 Java
1.3000~4000,一般对于双非本来说,hr能给出这种薪资,完完全全是侮辱人,而且我感觉是那种毛病贼多的小公司,遇上脾气不好的,能直接开骂,3-4k真的能招到人吗,属于是拉完了。2.4000~6000,可能是考研失败或者是hr看着是学校确实没那么好给出的价,如果是考研失败想找个地方过度一下准备二战的话,可以去一下,毕竟确实给的不多,校招都给这么点了,长期干的话薪资也不会涨到哪里去,这里给到npc。3.6000~8000,取中位数7k来看,除了某些提前规划大学生活,积累实习进入大厂的,我感觉这是大部分双非本能够拿到的工资,因为不管是boss上还是其他渠道,感觉普通后端开发都是这个数(以山东济南这边的情况来看),如果能双休而且是对口工作的话,这个薪资范围对双非本来说还是可以的,这里给到人上人。4.8000~10000,这个区间来看,感觉超越80%的双非本的同学了,如果你是9k而且双休,那简直是太舒服了,毕竟学历摆在那里,能拿到这个数,已经是“空调wifi冰镇西瓜”的级别了,这里必须夯爆了。5.10~15k,周围的同学极少能拿到这个数,甚至除了进大厂的同学们,很少看到双非本能拿到这个数,当然我指的是普通双非,但是能拿这个数,加班也少不了,而且如果能拿到这个数(相较于9k),那加班我感觉是少不了的,需要天天加班好几个小时,甚至双休都不能保证,但是能拿到这些数了,加会儿班就无可厚非了。第二点,如果能拿到这个薪资,那么这个同学肯定是在学习路上付出了很多的努力来弥补学历上带来的不足。在大学期间需要马不停蹄的来学习,如果也要严重加班的话,那综合来看,我会给到顶级。最后,目前我也是一名应届生,上述也是以山东目前的情况来说(如果是北上广深这样的城市那需要另外斟酌),以自己找工作的经历以及互联网上观察到的双非本的同学的秋招情况来看的,目前也还有好多的同学没有拿到心仪的offer,祝愿同学们拿到自己心仪的工作!!
一天代码十万三:都互联网了,就别看山东情况了
点赞 评论 收藏
分享
2025-12-29 22:36
武汉大学 Java
点赞 评论 收藏
分享
评论
78
464
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务