岗位:数据开发体验还不错,面试过程偏向聊天,会问一些新技术,从基础的框架为起点延申出一些问题,面试官也很友好,有些问题答不上来也说没关系问的相对基础,但但范围较广(忘记录屏以下为回忆,面试时长1h[蔚来数开一面]自我介绍实习介绍(因为前一份实习和数开相关性不是很大,只是写过sql就简单带过了没深挖kafka相关:kafka的结构优点,和其他消息队列相比优势在哪数仓项目(自己做的简单的电商数仓):问数据流的过程,用了哪些组件flume:了解flume吗(不了解就没继续问了hadoop:mapreduce的流程maptask的数量怎么定小文件过多的影响,怎么处理spark:spark简单介绍mr和spark的区别,spark宽窄依赖数仓理论:数仓分层的理论,各层的作用,维度建模的概念一道sql:新用户首日留存率一道算法:给一个数组,返回和为一个target的两个数的下标(剑指的简单题