NLP算法面经8
10.9 快手 NLP/LLM (2+0/2+1)
项目为主,每次基本也就3-5个八股,有重叠的
1. 实习/项目 问到底
2. Bert的架构介绍,Ernie架构
3. RAG的完整工作流
4. PPO和DPO的差别?
5. Deepspeed介绍下,主要问zero3阶段
6. LSTM和GRU的优缺点
7. MQA、GQA、MHA的不同和优点
8. Pre-LN和Post-LN的差别和优势
9. LLama2比LLama1的修改在哪些地方,数据量除外?
10. RAG对比SFT有何优势?
11. 大模型的词表有哪些?具体有什么不同?
12. 忘记了开放题
13. 代码题:旋转矩阵和皇后变体
14. 你对于该岗位的看法?
15. 未来职业规划?
#大模型# #面经# #互联网大厂# nlp #算法# 实习 #校招# #秋招#
项目为主,每次基本也就3-5个八股,有重叠的
1. 实习/项目 问到底
2. Bert的架构介绍,Ernie架构
3. RAG的完整工作流
4. PPO和DPO的差别?
5. Deepspeed介绍下,主要问zero3阶段
6. LSTM和GRU的优缺点
7. MQA、GQA、MHA的不同和优点
8. Pre-LN和Post-LN的差别和优势
9. LLama2比LLama1的修改在哪些地方,数据量除外?
10. RAG对比SFT有何优势?
11. 大模型的词表有哪些?具体有什么不同?
12. 忘记了开放题
13. 代码题:旋转矩阵和皇后变体
14. 你对于该岗位的看法?
15. 未来职业规划?
#大模型# #面经# #互联网大厂# nlp #算法# 实习 #校招# #秋招#
全部评论

您好,想问一下是两轮技术面吗?
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享