大数据开发面经【京东】
一面 电话面 40分钟
- 自我介绍
- 介绍实时数仓的项目
- 你这里用到了clickhouse,clickhouse的写入和读取为什么快
- flink有哪些算子
- flink的窗口函数了解吗
- flink的精准一次性如何保证的
- kafka是如何保证数据不丢失和不重复的,从生产者和消费者考虑
- hbase用过吗,rowkey的设计原则是什么
- 如何解决热点现象
- redis的数据结构了解吗
- java的spring会吗
- java的集合类有哪些
- java实现多线程的几种方式
- 你知道有哪些实现线程池的方式吗,讲一下有哪些类
- udf函数的分类
- 你实现的udf函数的功能
- 项目中最大的收获是什么
二面 视频面 45分钟
- 自我介绍
- 介绍了一下你的数仓项目
- 遇到过的最难的需求,怎么解决的
- MapReduce的执行过程
- zookeper的leader选举机制,常见的一些应用场景,举例说明
- kafka介绍一下
- spark中jvm调优怎么调
- hive优化你用过哪些,数据倾斜遇到过吗
- 你采用的数据存储格式是什么,相比于其他有什么优势
- flink和spark的区别是什么
- hashmap的底层原理是什么
- 你用过的一些linux命令
- 刷题:Leetcode10 正则表达式匹配
hr面 15分钟
- 自我介绍
- 你遇到过最大的挑战是什么,怎么解决的
- 你为什么选择京东
还有一些不记得了~~~~
总结
- 这个岗位可能不太偏向数仓,面试官说来了是做实时开发,做的东西会比较杂~
- 整体上面试体验还要,就是两轮技术面试官都迟到了