整理了一下提前批的面试 项目: 项目介绍一下 数仓建模,设计的每一层的作用?数据量有多大? Hive怎么创建分区表?项目有用到动态分区吗?用到过二级分区吗? 了解Hive调优吗?分区裁剪了解吗? HDFS写数据流程 一台DataNode宕机怎么处理 HQL语句的执行过程,验证用户权限在哪个组件?语法检查、表结构是否存在的检查在哪个组件? 对哪个大数据组件熟悉? HBase LSM树的思想说一下 MemStore中排序方法?跳表 ...