虾皮一面

时间: 50min
八股:
1. 你理解的agent是什么
2. decoder only的好处是什么
3. 为什么要rlhf,为什么要对齐
4. llama3怎么训练的(好奇怪的问题,别人家都问llama3用哪些技术,第一次被问是怎么训练的)
5. dpo原理,为什么要用dpo,与ppo改进
6. sft细节
实习:
1. 业务是什么
2. 组内多少人
3. 负责什么
4. 为什么用xx技术
5. 你去的时候已经做到什么样了
6. 为什么用xx模型
手撕:
LeetCode 第十题 hard
面试官问我,为什么不动笔呢,是不会吗没见过的hard臣妾是真做不到啊。看我做不出来就说先这样吧。
反问:什么业务
答:
1. 多语言大模型预训练(怪不得会问llama
3训练技术,以及很关心对齐阶段的八股)
2. 多模态
3. llm应用

已挂,手撕给hard就是征兆
全部评论
可能技术都大差不差,训练才重要
2 回复 分享
发布于 10-19 18:23 陕西
请问什么岗?
1 回复 分享
发布于 10-24 04:42 江苏

相关推荐

3 15 评论
分享
牛客网
牛客企业服务