度小满大模型算法实习生招聘坐标:北京度小满金融总部【岗位职责】1、大语言模型训练优化:参与大模型的监督微调、奖励模型、强化微调等技术的研究与优化,聚焦于解决模型在复杂指令遵循、推理、幻觉、工具使用等问题中的表现瓶颈,提升模型的实用性与可靠性。2、评估系统建设:收集、清洗训练数据,提高数据质量,开发和完善大模型评估系统,对模型能力水平进行多维评测,识别并解决模型可能存在稳定性、安全和幻觉问题,理解模型行为,并指导模型进行迭代。3、前沿探索:探索业界前沿的训练技术,设计并进行实验,分析大模型在不同数据分布和任务场景下的表现,发现并解决影响模型性能的关键问题,参与顶会论文、专利的撰写与发表。【岗位要...