一共两轮技术面一轮HR面,第一轮面试hive 问题居多,第二轮hadoop 问题居多,整体来说问题不是很难,方向为数仓。一面: 11.30下午 牛客网面试 30min自我介绍数仓项目介绍什么是全量表,什么是增量表,以及应用的场景了不了解拉链表,讲一下拉链表如何生成什么是内部表,什么是外部表,有什么区别Hive中小文件形成的原因及解决办法Hive SQL的优化方法讲一下熟悉的窗口函数及使用三道SQL 题 1. 聚合函数使用,order by+limit 2. sum(if(参数一,参数二,参数三))使用,以及count(null)为0 的考察 3. 一张表两列用户id 数据,求相互关注的...