双非鼠鼠太难了, 投了差不多两个月了就一两个面试还寄了,还是回家摆摊卖手打柠檬茶吧具体时间线忘了,三面后两周没消息后挂了。## 一面1. 自我介绍2. 实习经历和项目介绍 遇到最大的难点等3. sql优化细说4. 如果给你个全新的需求,你完全不了解,你会怎么做?5. 如果你是数据团队负责人,你会怎么让实习生快速上手项目6. 数仓模型分层介绍(数仓理论)7. 浏览器打开网页涉及哪些流程8. 你知道B站吧,B站主页有个搜索框、请问你怎么设计?9. sql题 最大连续登录天数 再细问开窗函数如果换sum 开窗范围是否有变化(考察开窗范围)## 二面自我介绍项目和实习经历介绍和深挖八股Hadoop主要主件有哪些Hdfs读写流程Spark和hadoop的区别Spark rdd算子有哪些union all会shuffue吗?宽窄依赖划分Scala 科里化参数能是函数吗?Flink了解吗介绍一下时间语义有哪些有哪些窗口水位线的理解任务卡住了如何解决Sql任务优化数据倾斜如何做空值如何处理热key如何处理数仓理论分层的好处给你一个新需求你怎么开发为什么选做大数据开发sql最后做一题最大同时在线人数感觉面试官思维比较发散一下子问下八股一下子问下实习经历,但聊的赶紧挺愉快的## 三面经典环节 自我介绍、实习、项目和科研中遇到的难点挖挖实习过程,具体怎么做的数据比对是怎么个流程sql优化有哪些方法flink是否有用过sql 两张表 一张访客表 一张订单表 求每个门店的top3商品率商品 商品率=商品购买数/商品访客数主要就是开窗和group by后面还补了个热key数据倾斜问题还有商品率是否会大于1面试官最后补了句感谢您的参与,我其实知道大概率凉了总结还是太菜了#数据仓库#