投的是蚂蚁的财富保险事业群吧,做支付宝理财里面相关的一些大模型业务的。面试官人好温柔,爱了。1. 自我介绍2. 问实习项目基本围绕项目去聊的涉及到了一些点项目里某个对齐的标签化你们是用固定的一些标签还是不固定的其他方式?(固定的维度,得到了面试官的认可 hh)有没有考虑过 DPO?DPO 的正负样本怎么构造的?你们训练框架用的啥?有没有了解过 deepspeed 的那几个阶段的区别,还有 offload?(不太了解)lora 用过吗?原理了解过吗?讲一下。有没有注意到 lora 论文里有一个 scale?(没有)有兴趣以后可以看看你们一般训练前怎么估算资源的?有没有想过怎么提高训练效率?有论文吗(无)感觉问的没有非常多,都是聊项目一些具体内容,八股比较少。也没做题,反正看样子是过了,面试官人也很好。