虾皮一面
时间: 50min
八股:
1. 你理解的agent是什么
2. decoder only的好处是什么
3. 为什么要rlhf,为什么要对齐
4. llama3怎么训练的(好奇怪的问题,别人家都问llama3用哪些技术,第一次被问是怎么训练的)
5. dpo原理,为什么要用dpo,与ppo改进
6. sft细节
实习:
1. 业务是什么
2. 组内多少人
3. 负责什么
4. 为什么用xx技术
5. 你去的时候已经做到什么样了
6. 为什么用xx模型
手撕:
LeetCode 第十题 hard
面试官问我,为什么不动笔呢,是不会吗没见过的hard臣妾是真做不到啊。看我做不出来就说先这样吧。
反问:什么业务
答:
1. 多语言大模型预训练(怪不得会问llama
3训练技术,以及很关心对齐阶段的八股)
2. 多模态
3. llm应用
已挂,手撕给hard就是征兆
八股:
1. 你理解的agent是什么
2. decoder only的好处是什么
3. 为什么要rlhf,为什么要对齐
4. llama3怎么训练的(好奇怪的问题,别人家都问llama3用哪些技术,第一次被问是怎么训练的)
5. dpo原理,为什么要用dpo,与ppo改进
6. sft细节
实习:
1. 业务是什么
2. 组内多少人
3. 负责什么
4. 为什么用xx技术
5. 你去的时候已经做到什么样了
6. 为什么用xx模型
手撕:
LeetCode 第十题 hard
面试官问我,为什么不动笔呢,是不会吗没见过的hard臣妾是真做不到啊。看我做不出来就说先这样吧。
反问:什么业务
答:
1. 多语言大模型预训练(怪不得会问llama
3训练技术,以及很关心对齐阶段的八股)
2. 多模态
3. llm应用
已挂,手撕给hard就是征兆
全部评论
可能技术都大差不差,训练才重要
请问什么岗?
相关推荐
查看2道真题和解析
点赞 评论 收藏
分享