1. mapreduce工作流程?2. shuffle机制?3. mapreduce进行了几次排序?4. 环形缓冲区的溢写机制?5. 提到了反向?反向如何理解?6. hadoop读取文件过程?7. 说说数据倾斜?项目中是否遇到8. MySQL介绍下InnoDB, MyISAM区别?9. 介绍下事务几大特性?10. 介绍对应隔离级别?11. 隔离级别是否可以修改?12. 三数之和,要求输出结果不重复13. 窗口函数求解累积用户访问数量;顺序如何保证14. 项目使用了flinkcdc, flume, kafka,介绍下作用?15. 数据量是多少16. 有无考虑单独使用MySQL来实现数据仓库HDFS这一套东西?17. 自己承担了什么工作内容18. 有什么样的成果19. 你对数据开发工作的理解? - 部门方向:SQL指标计算,理解业务需求;参与后端看板开发20. 简历项目内容少21. 反问 - 数据开发需要学的内容?主要看重实习生工作深度,框架后面可以学 - 算法刷题很重要!软件开发,代码能力很重要