蚂蚁大模型一面
投的是蚂蚁的财富保险事业群吧,做支付宝理财里面相关的一些大模型业务的。
面试官人好温柔,爱了。
1. 自我介绍
2. 问实习项目
基本围绕项目去聊的
涉及到了一些点
项目里某个对齐的标签化你们是用固定的一些标签还是不固定的其他方式?(固定的维度,得到了面试官的认可 hh)
有没有考虑过 DPO?DPO 的正负样本怎么构造的?
你们训练框架用的啥?有没有了解过 deepspeed 的那几个阶段的区别,还有 offload?(不太了解)
lora 用过吗?原理了解过吗?讲一下。有没有注意到 lora 论文里有一个 scale?(没有)有兴趣以后可以看看
你们一般训练前怎么估算资源的?
有没有想过怎么提高训练效率?
有论文吗(无)
感觉问的没有非常多,都是聊项目一些具体内容,八股比较少。也没做题,反正看样子是过了,面试官人也很好。
面试官人好温柔,爱了。
1. 自我介绍
2. 问实习项目
基本围绕项目去聊的
涉及到了一些点
项目里某个对齐的标签化你们是用固定的一些标签还是不固定的其他方式?(固定的维度,得到了面试官的认可 hh)
有没有考虑过 DPO?DPO 的正负样本怎么构造的?
你们训练框架用的啥?有没有了解过 deepspeed 的那几个阶段的区别,还有 offload?(不太了解)
lora 用过吗?原理了解过吗?讲一下。有没有注意到 lora 论文里有一个 scale?(没有)有兴趣以后可以看看
你们一般训练前怎么估算资源的?
有没有想过怎么提高训练效率?
有论文吗(无)
感觉问的没有非常多,都是聊项目一些具体内容,八股比较少。也没做题,反正看样子是过了,面试官人也很好。
全部评论
主要还是加强对推理优化相关八股 得多学学
约二面了吗?
相关推荐