上次挂了又被捞了,发出来攒攒人品,许愿oc4.8 一面4.10 二面👜面试岗位:核心本地商业-大模型算法📖面试问题:一面(105分钟):15分钟手撕三数之和(写的时候大于小于号写反了,找了好久Bug,还好写出来了)深入拷打论文项目实习对最近的图像编辑方法有了解吗?(回答最近openai发布的直接支持文字指令修改图像的模型)你觉得他们是怎么训练的?GRPO和PPO主要的区别在哪里?GRPO为什么选择组内奖励排序?有接触过强化学习方法吗?二面(50分钟):讲了一篇论文,然后纯聊天,无八股,无手撕。面试结束的时候我问后续流程,面试官说没有hr面了,二面通过就直接发offer,但是有没有hc不确定...