TCL实业 大数据工程师 面经
9.11 一面 35min:
1.自我介绍
2.专业介绍
3.Mysql索引
4.Mysql事务并发导致的问题
5.Mysql两种引擎的对比
6.Hadoop运行模式
7.job tracker 作用
8.Hdfs小文件问题
9.Hadoop调度器
10.Hadoop脑裂出现的原因
11.Kafka 怎样保证不丢数据
12.Flink task和subtask 的区别
13.并行度和slot的关系
14.Flink分组和分区的区别
15.flink时间语义
16.Watermark的理解
17.Flink的checkpoint
18.Datax用法 怎么实现增量同步数据
19.Hive和mysql的区别
20.Hive内部表外部表区别
21.Hive窗口函数
22.数据倾斜
23.Spark运行模式
24.RDD弹性体现
25.Spark reducebykey 和 groupbykey 区别
26.Map和mapPartition的区别
27.Hbase rowkey设计原则
28.Hbase二级索引原理
29.Clickhouse与hive区别
30.Clickhouse物化视图
31.Flink写入clickhouse数据一致性
32.实习工作内容
33.反问
----------------------------
9.12 通知一面通过
泡池子 回复面试官没时间
----------------------------
10.11 挂
#24届软开秋招面试经验大赏#