李先生_蚂蚁集团

LLM算法工程师

400-450元/天

北京

硕士

展开

岗位职责

工作地点：北京/上海/杭州团队介绍作为蚂蚁集团的核心大模型部门，我们专注大语言模型的技术攻坚与创新突破，致力于推动通用人工智能（AGI）技术的实质性进展。团队聚焦LLM后训练方向，包括模型对齐、高阶推理、安全可控等，持续完善智能系统的认知深度与可靠性。目前部门拥有数万张显卡资源，并且仍在持续加大投入，为探索模型能力边界提供坚实的保障。在追求AGI的道路上，我们始终秉持蚂蚁集团的技术务实基因，通过扎实的底层创新推动智能技术的产业落地。岗位职责 1. 参与大语言模型（LLM）后训练全流程优化，包括但不限于通用能力提升、安全对齐等方向。 2. 实现并应用SFT/RLHF/DPO/PPO/GRPO等算法，探索多目标奖励模型、过程监督等前沿技术，提升模型在指令遵循、逻辑推理、多任务泛化等方面的性能。 3. 构建模型效果评估体系，设计自动化评估方案，持续跟踪模型优化效果。 4. 参与技术开源与学术研究，发表顶会论文或贡献核心开源项目。

岗位要求

职位要求 ● 计算机科学、人工智能、数学等相关专业硕士及以上学历（优秀本科生可放宽）。 ● 熟练掌握 Python 和 PyTorch，具备分布式训练（如多机多卡调优）经验。 ● 深入理解 Transformer 架构及SFT/RLHF/DPO/PPO/GRPO等算法。 ● 在NeurIPS、ICML、ICLR、 ACL等顶会发表论文，或 Kaggle、ACM 竞赛获奖者优先。加分项 ● 具备大规模（千卡级）训练调优经验。 ● 大规模MoE架构训练/调优经验。 ● 长思维链/复杂任务推理经验。 ● 在开源社区（如 HuggingFace、GitHub）有突出贡献。我们提供 ● 顶尖资源：万卡集群算力支持，快速验证idea以及扩展scale。 ● 成长体系：与行业顶级研究员共事，参与国际前沿技术探索。 ● 薪酬福利：具有竞争力的薪资 + 股票激励 + 灵活工作制。

LLM算法工程师

400-450元/天

上海

硕士

展开

岗位职责

工作地点：北京/上海/杭州团队介绍作为蚂蚁集团的核心大模型部门，我们专注大语言模型的技术攻坚与创新突破，致力于推动通用人工智能（AGI）技术的实质性进展。团队聚焦LLM后训练方向，包括模型对齐、高阶推理、安全可控等，持续完善智能系统的认知深度与可靠性。目前部门拥有数万张显卡资源，并且仍在持续加大投入，为探索模型能力边界提供坚实的保障。在追求AGI的道路上，我们始终秉持蚂蚁集团的技术务实基因，通过扎实的底层创新推动智能技术的产业落地。岗位职责 1. 参与大语言模型（LLM）后训练全流程优化，包括但不限于通用能力提升、安全对齐等方向。 2. 实现并应用SFT/RLHF/DPO/PPO/GRPO等算法，探索多目标奖励模型、过程监督等前沿技术，提升模型在指令遵循、逻辑推理、多任务泛化等方面的性能。 3. 构建模型效果评估体系，设计自动化评估方案，持续跟踪模型优化效果。 4. 参与技术开源与学术研究，发表顶会论文或贡献核心开源项目。

岗位要求

职位要求 ● 计算机科学、人工智能、数学等相关专业硕士及以上学历（优秀本科生可放宽）。 ● 熟练掌握 Python 和 PyTorch，具备分布式训练（如多机多卡调优）经验。 ● 深入理解 Transformer 架构及SFT/RLHF/DPO/PPO/GRPO等算法。 ● 在NeurIPS、ICML、ICLR、 ACL等顶会发表论文，或 Kaggle、ACM 竞赛获奖者优先。加分项 ● 具备大规模（千卡级）训练调优经验。 ● 大规模MoE架构训练/调优经验。 ● 长思维链/复杂任务推理经验。 ● 在开源社区（如 HuggingFace、GitHub）有突出贡献。我们提供 ● 顶尖资源：万卡集群算力支持，快速验证idea以及扩展scale。 ● 成长体系：与行业顶级研究员共事，参与国际前沿技术探索。 ● 薪酬福利：具有竞争力的薪资 + 股票激励 + 灵活工作制。

LLM算法工程师

400-450元/天

杭州

硕士

展开

岗位职责

工作地点：北京/上海/杭州团队介绍作为蚂蚁集团的核心大模型部门，我们专注大语言模型的技术攻坚与创新突破，致力于推动通用人工智能（AGI）技术的实质性进展。团队聚焦LLM后训练方向，包括模型对齐、高阶推理、安全可控等，持续完善智能系统的认知深度与可靠性。目前部门拥有数万张显卡资源，并且仍在持续加大投入，为探索模型能力边界提供坚实的保障。在追求AGI的道路上，我们始终秉持蚂蚁集团的技术务实基因，通过扎实的底层创新推动智能技术的产业落地。岗位职责 1. 参与大语言模型（LLM）后训练全流程优化，包括但不限于通用能力提升、安全对齐等方向。 2. 实现并应用SFT/RLHF/DPO/PPO/GRPO等算法，探索多目标奖励模型、过程监督等前沿技术，提升模型在指令遵循、逻辑推理、多任务泛化等方面的性能。 3. 构建模型效果评估体系，设计自动化评估方案，持续跟踪模型优化效果。 4. 参与技术开源与学术研究，发表顶会论文或贡献核心开源项目。

岗位要求

职位要求 ● 计算机科学、人工智能、数学等相关专业硕士及以上学历（优秀本科生可放宽）。 ● 熟练掌握 Python 和 PyTorch，具备分布式训练（如多机多卡调优）经验。 ● 深入理解 Transformer 架构及SFT/RLHF/DPO/PPO/GRPO等算法。 ● 在NeurIPS、ICML、ICLR、 ACL等顶会发表论文，或 Kaggle、ACM 竞赛获奖者优先。加分项 ● 具备大规模（千卡级）训练调优经验。 ● 大规模MoE架构训练/调优经验。 ● 长思维链/复杂任务推理经验。 ● 在开源社区（如 HuggingFace、GitHub）有突出贡献。我们提供 ● 顶尖资源：万卡集群算力支持，快速验证idea以及扩展scale。 ● 成长体系：与行业顶级研究员共事，参与国际前沿技术探索。 ● 薪酬福利：具有竞争力的薪资 + 股票激励 + 灵活工作制。