自我介绍数仓分层sql 最近五天的下单用户left join左边三个数据,右边4个数据,最多会有几行数据数据倾斜的优化方案,举几个例子场景问题,如果例如下单转化率,肯定不超过1,那么如果这个指标会产生问题,那么应该监控哪些指标在工作中,如何保证一个新任务,按时按质按量交付反问二面自我介绍数据倾斜随便一个shuffle过程shuffle怎么优化为什么sparkshuffle比mr的好http介绍一下为什么用hive sql底层会对其做什么优化谓词下推是什么hbase布隆过滤器读写流程分裂过程tcp三次四次过程tcp udp区别java static 和final反射,泛型数组,链表排序介绍一下,时间复杂度反问