小米一面

🕒 岗位/面试时间
1h整
面试官是无脸怪
很细致的问每一步,但是感觉和面试官思路对不太上

👥 面试题目
1. ppo dpo异同
2. dpo推导,原理,loss
3. 讲讲其他rlhf
4. dpo对比ppo少了什么
5. lora初始化,为什么这么初始化,lora的秩用数学解释(真不会,线代早还给数学老师了)
6. 大模型贪心解码与beam search
7. 全方位拷打实习
8. 大模型效果如何评测
9. 模型部署相关

手撕: 四数之和,想了半天才想出来我好菜
全部评论

相关推荐

点赞 1 评论
分享
牛客网
牛客企业服务