算法面经1:大模型 金融大哥同花顺

9.1 同花顺 大模型(2+1)🚀
主要是以项目为主,掺杂八股,八股具体如下(忘记顺序是什么样子):
1. Transformer的自注意力机制及相比RNN的优势?
2. 自注意力计算中为何除以 $$\sqrt{d_k} $$?
3. 现在LLM微调的方式有哪些? 再问Adapter和Lora的区别?
4. LLM的架构有哪些?现在使用的是那种?为什么?
5. Prefix LM与Causal LM区别?
6. RLHF流程? 当时不太懂,没深问,现在需要多了解
7. 如何优化大模型训练速度?
8. 跨模态对齐你是如何做的?Q-Former与MLP适配器的优劣。
9. LLM训练中遇到Loss突增如何解决?

#实习# #秋招# #大模型# #nlp# #金融# #算法# #八股#
全部评论
老哥!请问实习是面几轮呀
点赞 回复 分享
发布于 03-16 19:28 上海
有手撕吗
点赞 回复 分享
发布于 03-16 21:14 湖北

相关推荐

评论
9
29
分享

创作者周榜

更多
牛客网
牛客企业服务