阿里 飞猪 大模型 暑期实习 一面&二面&hr面
已发意向
一面
手撕:三数之和
过实习
预训练数据构造
数据配比
如果现在重做一遍项目,怎么跟DeepSeek的技术结合
能不能直接通过RL训练chat模型
大模型八股
sft、dpo的区别,什么时候用哪个
MHA、GQA、MLA的异同
从Bert开始讲,位置编码的演进和注意力机制的关系
py八股
除了py外,还有用什么语言
进程、线程区别,什么时候用哪个
平常用的什么包,numpy、pandas有用吗
生成器、迭代器
日常
有没有其他在投,城市偏好
反问
评价?整体不错
业务?有训练做知识注入、也有做问答系统
流程?三面,两面技术一面hr
大概40min
二面
无手撕
聊科研
介绍实习
灾难性遗忘怎么缓解的
sft后什么情况下用dpo
对大模型的发展方向怎么看
反问
评价?满意,过
给实习生资源做探索性实验?给
约25min
hr面
问base、实习收获
其他的忘了,没有技术相关的
反问
意向?3天内,实际面完秒发
约20min
总结:一面有些八股,问py八股是没想到的,另外三轮面试都问base,说广东人很多不愿意出省