字节/阿里/美团/京东 大数据开发 面经

先说下个人背景 计算机科班 本科211 硕士双非(
目前是字节意向、阿里HR面完、美团HR面完、京东意向
其实再面试之前就觉得大数据开发的面经比较少,通过海量搜索还是找到许多有用的面经,这里简单说一下最近秋招的面经
笔试就不说了,一搜一堆,基本上只要过60%就算挺不错了,就算稳过笔试阶段很可能进面了。

字节:data数据平台 实习转正
这里就简单说下春招实习的面经和转正答辩的一些问题吧
实习一面:
java八股文,引用类型基本类型的区别,list map hashmap接口继承关系,linkedlist arraylist hashmap实现等
大数据部分,hadoop框架,namenode,联邦namenode,spark rdd,spark和mr区别,转换算子和action算子
sql题一道,忘了,不难
算法题:返回一个用当前数的各位数字组成的比输入数大的最小的数,比如1234返回1243
实习二面:
spark有哪些算子,spark比mapreduce的优势,spark shuffle具体实现,和mr shuffle的对比,spark内存
然后问了很多不相关的科研项目(简历上写的)和一些宏观的问题,比如大数据的核心思想是什么(分治)
算法题:20M内存 100G文件 找top10的url
实习三面:
主管面,忘了问了啥,问了一点点大数据框架spark hive hadoop啥的
是否看过大数据的三驾马车的论文,讲一讲
大多数都是问的宏观问题和一些比如啥时候能到岗实习多久这种
sql题忘了,也不难
算法题:一个有序数组找唯一重复的数,需要多种方法,用了双指针 hashmap 位运算等
HR面忘了,也没记,反正就是常规问题
转正答辩问题:
一些实习期间工作和项目的问题
大数据开发的核心竞争力在哪

阿里:阿里云
电话面试(一面)+视频面试(二面)+HR面
电话面试:
字节实习的部门,主要干了啥,有什么收获(讲的比较多,发现实习还是很重要的,秋招面试官一半时间都在问实习相关的问题)
数仓分层和各层的作用,dwd和dwm的区别,dwm和dm区别等
离线数仓和实时数仓开发的异同
主题域怎么建设,横纵主题都有什么用
视频面试:
字节实习相关,说了快二十分钟
是否遇到过数据倾斜,怎么解决的
Java相关,问java掌握到什么程度,为什么学java,一些简单的java八股文
hashmap底层实现(这个也太常见了,兄弟们还是得多背背八股文)Hashtable、ConcurrentHashMap
计算机网络:https和http区别,session和cookie,https加密
SQL题,挺简单的就是班级成绩排名之类的
HR面:阿里的HR面真的专业,各种技术问题,我还以为是技术面
字节实习相关,啥部门的干了啥建了哪些数仓模型和表
字节内部数仓开发用的啥框架,实时和离线都用的啥
字节内部用的flink和现在外面开源的flink(其实就是阿里的flink,毕竟flink都被阿里收购了)有啥区别没,字节内部的flink有什么新功能?
关注过hdfs和yarn队列么,平时遇到过哪些问题需要去hdfs和yarn队列中解决?
对大数据开发的理解,对数仓的理解
为何要来阿里(吹了波阿里的技术)以及其他常见HR问题

京东:京东科技
视频面试(一面)+电话面试(二面)+HR面
京东就比较奇怪了,一面视频二面电话
视频面试(一面):
字节实习相关,问题和上面差不多,哪个部门的,干了啥,数仓怎么分层的,每层意义是啥,解决了什么实际问题(说了快半小时,看来实习真的很重要,简历上一写其他的内容面试官就像没看见一样,只问实习了)
join key的选择和优化
八股文:TCP  进程间通信方式 java final finally finalize
没问算法
电话面试(二面):
字节实习相关。。。。每次感觉都要重复回答很多实习问题,这次还问到了如何保证代码质量,需求开发流程,数据治理等
Hive的作用,具体实现
java和python的特性和优势
算法题:小内存,在一亿条URL里面查找出现次数最多的URL(字节面试也问到过,这个可能是大数据方向必问的吧)
HR面:10分钟结束了,还以为是刷kpi,打开官网一看通过了
就随便问了问,字节实习期间遇到了什么困难怎么解决的,科研上发表了哪些成果

美团:到店
视频面试(一面)+视频面试(二面)+HR面
美团感觉还是比较看重大数据的,整体面下来感觉和字节差不多
视频面试(一面)
字节实习相关
问了下如何对spark任务优化(去spark web ui看stage和task运行情况,比对运行时间,GC时间,读写分区大小等,发现是内存不足还是数据倾斜等,然后怎么解决的)
spark rdd,spark shuffle
hive的作用和底层实现
mysql b+树、索引、最左匹配原则
数仓和数据库的区别
数仓为什么要分层
数仓维度建模和范式建模
SQL题:最大连续登录天数
视频面试(二面)
字节实习相关(问的也挺细的,20min)
问字节实习转正了没,为啥还要面美团(这里强行狂吹了一波美团)
用过哪些HSQL函数(开窗row_number()、lag lead等,时间戳date转换,json读取等)
写过UDF么,具体UDF干啥的,怎么上传到Hive上
HSQL去重 distinct/group by/row_number()的区别,底层shuffle和reducer区别
面了几家公司了?结果如何?要怎么选择offer?(又狂吹了一波美团)
没有sql题和算法题
HR面:美团HR面也问的挺细的
字节实习干了啥,对部门做出了什么贡献,实习中遇到了什么困难怎么解决的,实习是否符合预期,实习收获了什么
科研项目:发表了什么科研成果,讲讲你科研成果主要是干了什么(hr不懂具体技术,就举了个例子描述了下)
意向地是哪,字节 美团 阿里 京东怎么选择(又吹了一波美团)


--------------分割线,以上就是大数据开发的相关面经了-------------
其实还面了一些java后端开发,包括华为啊,百度啊,腾讯啊就不细写了,随便说下
华为(消费者):技术方面比较水,八股文背好,算法题easy难度,反转链表和一道数组题,主管面喜欢问你性格方面,华为企业文化之类的
百度:八股文:list map set java底层实现 计算机网络、操作系统等,算法题判断链表是否有环、输出环入口,二面问了很多很奇怪的问题,比如操作系统32位 64位啥意思,32位的虚拟内存最大多大,问了hadoop的一些问题,算法题忘了,听简单的,出了一道我两分钟写出来了,然后又出了两道,反正都写出来了,然后说你基础不错,回答的不错,等会问下经理讨论下面试结果,然后就把我挂了(淦
腾讯:八股文:各种锁,乐观锁悲观锁,死锁活锁,Synchoronize和lock,mysql b+树,索引,事务acid,幻读,java equals == hashcod JVM 垃圾回收机制 双亲委派机制  redis等等吧,算法题LRU

--------------分割线:就这吧我累了-------------------
秋招互联网大厂就这了,还有一些比如网易游戏、百度挂了捞我之类的都拒了,也懒得投其他的了,好好写论文了,看看还有没有优质国企事业单位之类的
纯手打码字不易希望看完了点个赞







#2022秋招##面试题目##阿里巴巴##京东##美团##字节跳动##大数据开发工程师#
全部评论
想问一下面大数据,jvm,juc和sql调优还需要学习吗😂
2 回复 分享
发布于 2021-10-23 10:07
楼主阿里什么部门呀?
点赞 回复 分享
发布于 2021-09-16 23:37
羡慕啊,大佬好强
点赞 回复 分享
发布于 2021-09-17 16:15
大佬字节实习了多久啊?
点赞 回复 分享
发布于 2021-09-19 17:03
阿里就两面技术面?
点赞 回复 分享
发布于 2021-09-20 14:16
太强了
1 回复 分享
发布于 2021-09-23 09:29
楼主阿里和字节怎么选呀?跟你经历比较相似想问一下
点赞 回复 分享
发布于 2021-09-29 18:12
大数据岗有笔试吗或者对于算法考查的多吗
点赞 回复 分享
发布于 2021-10-27 21:20

相关推荐

11-01 20:03
已编辑
门头沟学院 算法工程师
Amazarashi66:这种也是幸存者偏差了,拿不到这个价的才是大多数
点赞 评论 收藏
分享
Yushuu:你的确很厉害,但是有一个小问题:谁问你了?我的意思是,谁在意?我告诉你,根本没人问你,在我们之中0人问了你,我把所有问你的人都请来 party 了,到场人数是0个人,誰问你了?WHO ASKED?谁问汝矣?誰があなたに聞きましたか?누가 물어봤어?我爬上了珠穆朗玛峰也没找到谁问你了,我刚刚潜入了世界上最大的射电望远镜也没开到那个问你的人的盒,在找到谁问你之前我连癌症的解药都发明了出来,我开了最大距离渲染也没找到谁问你了我活在这个被辐射蹂躏了多年的破碎世界的坟墓里目睹全球核战争把人类文明毁灭也没见到谁问你了😆
点赞 评论 收藏
分享
31 177 评论
分享
牛客网
牛客企业服务