腾讯音乐 暑期实习 nlp 二面
1.问项目
2.场景题+八股
大模型幻觉问题怎么解决
RAG模型的一些问题 怎么解决
大模型微调用的什么框架?
deepspeed的zero1 2 3
llama的7b模型显存占用情况 参数量到显存占用如何换算?
Lora的原理 为什么不在layernorm层也做lora? embedding层能不能用lora?
layernorm在训练和推理时有什么不同?
3.问了一些个人的情况
#面试经验##算法面试经验分享#1.问项目
2.场景题+八股
大模型幻觉问题怎么解决
RAG模型的一些问题 怎么解决
大模型微调用的什么框架?
deepspeed的zero1 2 3
llama的7b模型显存占用情况 参数量到显存占用如何换算?
Lora的原理 为什么不在layernorm层也做lora? embedding层能不能用lora?
layernorm在训练和推理时有什么不同?
3.问了一些个人的情况
#面试经验##算法面试经验分享#相关推荐