字节跳动大数据-Data面经

忘得差不多了,说下我记得的
1面:
ConcurrentHashmap底层是怎样的,怎么保证线程安全
synchronize底层原理
了解哪些GC算法
CAP原则
Zookeeper的一致性协议
了解哪些其它的一致性协议
算法题:大数组求中位数

2面:
项目
了解哪些blockingQueue,分别有什么特点
算法题:利用blockingQueue设计一个生产者消费者模式,如果是nonBlockingQueue应该怎么修改
了解mysql吗,mysql有哪些索引,知道覆盖索引吗(好像是这个,反正我答的不知道)
spark宽窄依赖

3面:
自我介绍+项目(貌似他不感兴趣,说一半打断我了)
算法题:两个字符串的最大公共子串
使用spark写一个wordcount
从这个spark程序打包提交到spark集群之后,分别发生了什么
spark宽窄依赖,程序中有几个stage
程序中的rdd有几个partition
如果要增加并发应该使用什么参数,executor和core的比例怎么设置(这里我答错了,太久没用都记不清了)
如果发生数据倾斜怎么处理
如果某些task很慢应该怎么处理
一个volatile修饰的变量x,100个线程执行x++,最终结果是多少。
了解哪些java的锁

大概就这么多,3面逮着spark调优一直问。
#面经##字节跳动##大数据开发工程师##校招#
全部评论
楼主你好,请问你是实习、校招还是社招?
点赞 回复 分享
发布于 2020-08-13 21:27
spark wordcount是手撕代码吗还是让用编辑器啊
点赞 回复 分享
发布于 2020-08-13 23:39
楼主你好,volatile那题是什么答案呢
点赞 回复 分享
发布于 2020-08-14 00:05
楼主,那个大数组中的中位数是跟数据流中的中位数的解题思路很像么?是用双堆法么?
点赞 回复 分享
发布于 2020-08-14 11:11
请问一下spark是必备技能咩?这个用的比较少,感觉三面一直在问spark哦
点赞 回复 分享
发布于 2020-08-15 21:47
如果不出意外的话 我会挂在你的三面
点赞 回复 分享
发布于 2020-08-16 14:38
请问楼主面的是data哪个部门
点赞 回复 分享
发布于 2020-08-20 22:34
咋这么多高并发的问题呀?最怕高并发了
点赞 回复 分享
发布于 2021-07-27 23:40

相关推荐

ProMonkey2024:5个oc?厉害! 但是有一个小问题:谁问你了?😡我的意思是,谁在意?我告诉你,根本没人问你,在我们之中0人问了你,我把所有问你的人都请来 party 了,到场人数是0个人,誰问你了?WHO ASKED?谁问汝矣?誰があなたに聞きましたか?누가 물어봤어?我爬上了珠穆朗玛峰也没找到谁问你了,我刚刚潜入了世界上最大的射电望远镜也没开到那个问你的人的盒,在找到谁问你之前我连癌症的解药都发明了出来,我开了最大距离渲染也没找到谁问你了我活在这个被辐射蹂躏了多年的破碎世界的坟墓里目睹全球核战争把人类文明毁灭也没见到谁问你了(别的帖子偷来的,现学现卖😋)
点赞 评论 收藏
分享
6 50 评论
分享
牛客网
牛客企业服务