一面 视频 一个半小时 自我介绍 介绍最近做的一个项目或者觉得不错的项目 对项目的一些提问 数仓分层,分层的好处? 如何消费kafka的数据? 指标库怎么搭建的? 数据从hdfs到hive的具体过程? 项目的数据量如何? hdfs的基本架构? hive的基本架构,角色,与hdfs的关系? 直接将数据文件上传到hdfs的表目录中,如何在表中查询到该数据? hive的底层引擎模式? yarn的了解 spark各种运行模式的区别? hive自定义函数编写步骤? 表关联方式? 拉链表如何实现,应用场景 笛卡尔积 项目中遇到的问题,困难点在哪?怎么解决的? 反问 总结:面试官很友好,主要针...