已发意向一面手撕:三数之和过实习预训练数据构造数据配比如果现在重做一遍项目,怎么跟DeepSeek的技术结合能不能直接通过RL训练chat模型大模型八股sft、dpo的区别,什么时候用哪个MHA、GQA、MLA的异同从Bert开始讲,位置编码的演进和注意力机制的关系py八股除了py外,还有用什么语言进程、线程区别,什么时候用哪个平常用的什么包,numpy、pandas有用吗生成器、迭代器日常有没有其他在投,城市偏好反问评价?整体不错业务?有训练做知识注入、也有做问答系统流程?三面,两面技术一面hr大概40min二面无手撕聊科研介绍实习灾难性遗忘怎么缓解的sft后什么情况下用dpo对大模型的发展...