字节大数据1面
Mysql索引
有哪些索引、区别
为什么在hive里没用索引
数据库的三范式
内连接和外连接
Mapreduce原理,有几次分组
给一段sql,问有几个task
遇到过数据倾斜吗
数据倾斜的原因
除了数据倾斜外还会遇到别的问题吗
Hive调优
使用过hive的一些参数
一个任务跑的很慢的话要怎么优化这个任务
SQL调优有做过什么
Hdfs的读写流程
Sqoop的原理,能实现哪些功能
离线数仓是怎么做的
每层有几张表,为什么有这些表
活跃和留存这些表是怎么设计的
需求的对接流程是怎么样
数据出现异常的话怎么去排查
Udf udtf udaf是什么 区别
Udf从开发到使用的整个流程
有做过哪些udf,为什么要用udf实现
项目的技术难点
Hive和spark的数据倾斜的区别
写sql题
算法题是回文字符串
#字节跳动##大数据开发工程师##面经#