9.3 15:00 腾讯 TEG 后台开发大数据方向 一面总结: 时长:30分钟左右 1.自我介绍 2.介绍项目架构,用到什么框架,数据量有多大 3.介绍项目和竞赛中的问题和解决算法,有用到什么深度学习的模型? 4.Flume Sink中使用什么类型?HDFS Sink如何处理小文件? 5.left join和right join的区别 6.map算子和mapPartitions算子有什么异同? 7.spark广播变量什么情况下使用 8.spark内存管理模型,RDD的数据都会出现在哪里 9.flink会用吗? 10.SQL题: 表-课程:cid,cname; 表-成...