字节跳动大数据-Data面经
忘得差不多了,说下我记得的
1面:
ConcurrentHashmap底层是怎样的,怎么保证线程安全
synchronize底层原理
了解哪些GC算法
CAP原则
Zookeeper的一致性协议
了解哪些其它的一致性协议
算法题:大数组求中位数
2面:
项目
了解哪些blockingQueue,分别有什么特点
算法题:利用blockingQueue设计一个生产者消费者模式,如果是nonBlockingQueue应该怎么修改
了解mysql吗,mysql有哪些索引,知道覆盖索引吗(好像是这个,反正我答的不知道)
spark宽窄依赖
3面:
自我介绍+项目(貌似他不感兴趣,说一半打断我了)
算法题:两个字符串的最大公共子串
使用spark写一个wordcount
从这个spark程序打包提交到spark集群之后,分别发生了什么
spark宽窄依赖,程序中有几个stage
程序中的rdd有几个partition
如果要增加并发应该使用什么参数,executor和core的比例怎么设置(这里我答错了,太久没用都记不清了)
如果发生数据倾斜怎么处理
如果某些task很慢应该怎么处理
一个volatile修饰的变量x,100个线程执行x++,最终结果是多少。
了解哪些java的锁
大概就这么多,3面逮着spark调优一直问。
#面经##字节跳动##大数据开发工程师##校招#