部门:腾讯TEG-机器学习平台-NLP### 03-19一面:项目code: 买股票交易一次,多次,—贪心,dp模型出现复读现象应该怎么办,即使SFT之后依然存在会怎么办?如何看待让大模型具有知识的RAG框架,context length increasing还有嘛?### 03-21二面:SFT,RLHF的训练过程,reward model怎么训练的有没有尝试去提升过模型的效果?在下游任务上的结果。### 03-25腾讯三面项目介绍一下RLHF流程RL — Actor-Critic Methods: A3C, GAE, DDPG, Q-prop### 03-29HR面 什么时候会有oc呢?别最后排序挂了吧 QAQ!4.2号 已OC#腾讯##腾讯TEG##自然语言处理实习##腾讯HR面试#