复盘阿里巴巴CBU大数据开发一面面经

1.简单介绍下自己
2.哪个项目有技术含量,简单介绍下
3.围绕项目,遇到的困难和挑战,数据量之类
4.简单介绍一下HDFS架构(我竟然当成HBase了,然后一本正经介绍HBase、、、)
5.(HDFS)的特色,我还是回答的HBase的、、、
6.他(HDFS)分布式系统,怎么实现的,多机器存储文件怎么交互的,数据一致性怎么保障,有个特色是机架感知了解过么(直到关于HDFS的问题高一段落,两个人的平行交流才算结束,怪我太紧张,心里还寻思机架感知不是HDFS上的么)
7.MySQL统计分析的极限,数据量多少会变慢
8.索引有没有了解过,为什么用B+树存储,建立一个索引的时候是新建了一个b+树吗,表里有多少索引就有多少b+树吗,(a)(a,b,c)
9.MySQL不好的地方,应用的问题,提到了上面7说的,表大会比较慢(给自己挖坑了,不是特别了解的不要提),扯到了大表优化,水平拆分的原则,id怎么拆分比较好
10.hash什么情况下造成冲突,hash冲突的原理是什么,算法是怎样的
11.大表已经拆分好了,一万条数据按照用户id拆分到十个分区,查地区是浙江的用户应该怎么查,分区的时候怎么避免这个问题
12.用过kafka哪些特性,怎么保障顺序性,有没有测试过kafka极限性能,设计原理,怎么设计的,kafka消息能做持久化吗
13.G1了解过吗,full gc的过程,对系统的影响,jvm所有线程都会停顿吗
14.对jdk有关注吗,jdk1.8的新特性
15.7的2007次方最后一位是多少
16.反问后建议关注新技术,jdk新特性,开源新框架,对新技术的热情
实际问题接触的比较少,你再准备一下吧,到时候还会再有面试。

#面经##大数据开发工程师##实习#
全部评论
我想问一下,你投的岗位是数据开发,还是研发工程师java?
点赞
送花
回复 分享
发布于 2021-03-26 11:18

相关推荐

3 29 评论
分享
牛客网
牛客企业服务