一面 3.2 大数据开发工程师-抖音/直播/剪映 1、自我介绍一下 2、介绍一下你的项目?(没想到一面就在问项目,一直在背八股文) 2.1 AI政策只是做标注?那你知道你们的这个模型是什么吗 2.2 推荐系统:有接触spark SQL吗?使用ALS算法是因为课程使用还是?(好像回答了出于数据特征方便简洁) 3、介绍一下MR 4、说一下Spark下的MR比Hadoop下的MR有什么优势 5、Spark的数据倾斜是什么?(我回答是有的分区数据量过大,分区之间数据分配不均衡) 6、hdfs中默认的数据块副本数? 7、知道Hive吗(不知道) 8、介绍一下dp算法 9、算法题 9.1...