算法面经3:nlp和llm,商汤科技

商汤 LLM (2+0)🥲 二面后挂了
1. 主要是以项目为主,讲完项目,提问发散问题以及八股。
2. Baichuan2-7B的架构讲一下,有什么特别之处?
3. Lora微调7B模型,可训练参数是多少?显存占用如何?
4. 介绍下Lora以及qlora的区别
5. 其它多模态对齐方式有哪些?
6. LSTM与Transformer的区别,以及后者的优势?
7. 讲解下scaling law
8. 预训练一般分为哪些阶段,每个阶段的特点有何区别?
#春招# #实习# #秋招# #ai算法工程师# #大模型# #nlp算法工程师# #商汤科技#
全部评论

相关推荐

评论
4
11
分享

创作者周榜

更多
牛客网
牛客企业服务