快手二面
30min,无手撕
全程聊对于各种算法的理解与场景题
1. long cot重复冗余怎么办
2. grpo原理,怎么实现的偏好排序,能否用于传统推荐模型,优势怎么计算的,为什么要对奖励规范化,和ppo异同,对比ppo优秀点在哪里
3. dpo原理,dpo和grpo谁效果更好,为什么,dpo数据格式,dpo为什么性能不够好,dpo和grpo异同,dpo变体,dpo的思想,dpo的缺陷,dpo对搜索推荐的启示
4. 生成式搜推有了解吗,Google最新的生成式推荐看过吗。没看过的话,你讲一讲如果让你做生成式推荐你会如何做
5. 大模型很难满足实时性要求,把他们用于搜推系统里你有什么思考,能否通过蒸馏指导传统搜推能力
6. mtp怎么提升模型性能
全程聊对于各种算法的理解与场景题
1. long cot重复冗余怎么办
2. grpo原理,怎么实现的偏好排序,能否用于传统推荐模型,优势怎么计算的,为什么要对奖励规范化,和ppo异同,对比ppo优秀点在哪里
3. dpo原理,dpo和grpo谁效果更好,为什么,dpo数据格式,dpo为什么性能不够好,dpo和grpo异同,dpo变体,dpo的思想,dpo的缺陷,dpo对搜索推荐的启示
4. 生成式搜推有了解吗,Google最新的生成式推荐看过吗。没看过的话,你讲一讲如果让你做生成式推荐你会如何做
5. 大模型很难满足实时性要求,把他们用于搜推系统里你有什么思考,能否通过蒸馏指导传统搜推能力
6. mtp怎么提升模型性能
全部评论
相关推荐

点赞 评论 收藏
分享