总体感觉良好,通过面试官的介绍可知这个岗位偏向离线数仓。1.自我介绍2.询问了其中一段实习经历3.讲下你说用过的Linux命令4.讲下HIVE的内部表和外部表有什么不同*5.讲下你使用过的Hive函数(好好在复习下多准备几个吧)*6.请讲下维度建模和范式建模的区别(自上而下,自底而上,关系-实体,事实-维度)*7.为什么关系型数据库更适合范式建模而数仓适合维度建模8.讲下数据倾斜*9.HIVE的分区和分桶(分区是放在不同目录下,分桶是放在不同文件中)10.什么是Hive-on-mr什么是Hive-on-spark11.又问了简历的另一段实习经历*12.复述下你曾经做过的一个数据科学的项目,你做了多少,是不是你一个人做的(这个问题失误在于,没有挑典型项目讲,现在要准备下稿子)12.这个岗位是实习岗,不会影响你秋招吗12.经典的反问环节