2022/06/25 一面 35min 1:介绍项目 2:数仓分为几层?每一层作用? 3:数仓分层的意义? 4:flume导入数据到HDFS 为什么中间加kafka? 5:项目中可视化用什么做的? 6:SQL题 一列为日期 一列为金额 按月统计金额总和 7:MapRedcue原理 8:MapReduce的三个阶段 9:研究生上的课 10:接触过实时的大数据业务吗? 反问:部门技术栈 ?实习的话就是SQL为主 哪里需要补充知识?多了解一些实时业务方面内容 未来职业规划?考不考虑做AI? 实习的主要工作? 在实时项目中的技术选型的理由?实时中最大的困难?(OOM 最近...