小米一面
🕒 岗位/面试时间
1h整
面试官是无脸怪
很细致的问每一步,但是感觉和面试官思路对不太上
👥 面试题目
1. ppo dpo异同
2. dpo推导,原理,loss
3. 讲讲其他rlhf
4. dpo对比ppo少了什么
5. lora初始化,为什么这么初始化,lora的秩用数学解释(真不会,线代早还给数学老师了)
6. 大模型贪心解码与beam search
7. 全方位拷打实习
8. 大模型效果如何评测
9. 模型部署相关
手撕: 四数之和,想了半天才想出来我好菜
1h整
面试官是无脸怪
很细致的问每一步,但是感觉和面试官思路对不太上
👥 面试题目
1. ppo dpo异同
2. dpo推导,原理,loss
3. 讲讲其他rlhf
4. dpo对比ppo少了什么
5. lora初始化,为什么这么初始化,lora的秩用数学解释(真不会,线代早还给数学老师了)
6. 大模型贪心解码与beam search
7. 全方位拷打实习
8. 大模型效果如何评测
9. 模型部署相关
手撕: 四数之和,想了半天才想出来我好菜
全部评论
相关推荐
点赞 评论 收藏
分享
12-11 00:22
同济大学 区块链 点赞 评论 收藏
分享