虾皮 NLP 一面
体验非常非常差,面试官迟到一小时,面的时候刚睡醒,kpi连演都不演了
八股
1. 大模型微调用到了什么框架
2. Lora的训练原理和使用是怎么样的?
3. llama的模型结构
4. Pre-norm和Post-norm的差别是什么
八股
1. 大模型微调用到了什么框架
2. Lora的训练原理和使用是怎么样的?
3. llama的模型结构
4. Pre-norm和Post-norm的差别是什么
全部评论
面试官迟到一小时?
相关推荐
03-24 18:14
中山大学 C++ 点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享