大数据开发工程师(偏数仓) 一面(50分钟): 1,自我介绍+实习工作 2,简单描述一下MapReduce过程 3,hive数据倾斜是什么,如何处理 4,hive和spark SQL的区别 5,数仓的结构简单描述一下 6,yarn和hbase了解吗,yarn有哪些常用的接口?(很诚实的说了不太了解yarn,hbase有一些了解。于是简单介绍了一些hbase的架构) 7,hbase的文件如何存储?hbase的为什么查询速度快。 8,分享大学或研究生最有成就得一件事(然后就开始问计算机基础知识了) 9,数据库三范式,介绍一下索引 ...