美团数据挖掘
岗位名是数据开发,实则是做数据挖掘的组。问了很多算法😅
1.介绍spark2.hash shuffle和sort shuffle区别3.文件少了什么会快?4.hash连接和join连接区别5.spark streaming和flink区别6.对NLP处理技术的了解7.讲一下什么是降维8.一个简历怎么变为一个向量9.编码器的输出是啥10.编码器和解码器为什么不同?11.编码器为什么不能生成12.GBDT讲一下13.它的目标函数咋设计的14.GBDT每个决策树拟合的目标是啥,为什么不能用一颗决策树。
1.介绍spark2.hash shuffle和sort shuffle区别3.文件少了什么会快?4.hash连接和join连接区别5.spark streaming和flink区别6.对NLP处理技术的了解7.讲一下什么是降维8.一个简历怎么变为一个向量9.编码器的输出是啥10.编码器和解码器为什么不同?11.编码器为什么不能生成12.GBDT讲一下13.它的目标函数咋设计的14.GBDT每个决策树拟合的目标是啥,为什么不能用一颗决策树。
全部评论
还在用gbdt?
相关推荐
点赞 评论 收藏
分享