1、自我介绍2、数据仓库为什么要分层,目的是什么3、DWS层和DWT层是怎样划分的4、PV和UV分别是什么5、数据仓库建模的两种形式6、范式建模中的第三范式的原则7、维度建模中最常见的建模形式是什么区别是什么8、如何评判数仓的优劣性9、MR流程是写的MR程序,还是通过hql10、用户留存率的计算公式11、HDFS的写流程12、MR的底层原理13、MR是分为哪几个阶段,每个阶段的主要任务是什么14、YARN的工作原理15、spark的核心是什么16、 RDD的五大属性17、数据倾斜的产生原因,在哪个阶段产生18、数据倾斜的解决办法19、mysql的索引机制,在什么场景用,为什么要用索引,什么样的字段可以用索引20、场景题,A表三条数据,B表五条数据,如果用left join,查询结果的范围是什么21、15分钟内手撕三道SQL22、未来的职业规划23、对公司的期望 #2023秋招# #面经#