🕒 岗位/面试时间1h👥 面试题目1. 拷打实习2. 拷打学校项目3. 如果我有1000个function,怎么用大模型做function call4. sft流程,显存计算5. dpo局限性,显存计算,和ppo区别6. zero 123原理和 用没用过7. 激活重计算原理8. transformers trainer 参数9. 做过推荐吗,讲讲推荐的模型10. 单双塔讲讲(讲错了,被狠狠科普了)11. dpo怎么改进12. 为什么attention需要位置编码手撕 最长公共子串整体拷打比较轻微,面试官很和善友好,面试体验佳,不得不说鹅的面试体验真不错,没有那种冷脸面试官