李先生
蚂蚁集团·算法工程师
昨日
上次在线
79%
反馈率
2天
处理时长
在招职位 (3)
LLM算法工程师
400-450元/天
北京
硕士
岗位职责
工作地点:北京/上海/杭州
团队介绍
作为蚂蚁集团的核心大模型部门,我们专注大语言模型的技术攻坚与创新突破,致力于推动通用人工智能(AGI)技术的实质性进展。团队聚焦LLM后训练方向,包括模型对齐、高阶推理、安全可控等,持续完善智能系统的认知深度与可靠性。目前部门拥有数万张显卡资源,并且仍在持续加大投入,为探索模型能力边界提供坚实的保障。在追求AGI的道路上,我们始终秉持蚂蚁集团的技术务实基因,通过扎实的底层创新推动智能技术的产业落地。
岗位职责
1. 参与大语言模型(LLM)后训练全流程优化,包括但不限于通用能力提升、安全对齐等方向。
2. 实现并应用SFT/RLHF/DPO/PPO/GRPO等算法,探索多目标奖励模型、过程监督等前沿技术,提升模型在指令遵循、逻辑推理、多任务泛化等方面的性能。
3. 构建模型效果评估体系,设计自动化评估方案,持续跟踪模型优化效果。
4. 参与技术开源与学术研究,发表顶会论文或贡献核心开源项目。
岗位要求
职位要求
● 计算机科学、人工智能、数学等相关专业硕士及以上学历(优秀本科生可放宽)。
● 熟练掌握 Python 和 PyTorch,具备分布式训练(如多机多卡调优)经验。
● 深入理解 Transformer 架构及SFT/RLHF/DPO/PPO/GRPO等算法。
● 在NeurIPS、ICML、ICLR、 ACL等顶会发表论文,或 Kaggle、ACM 竞赛获奖者优先。
加分项
● 具备大规模(千卡级)训练调优经验。
● 大规模MoE架构训练/调优经验。
● 长思维链/复杂任务推理经验。
● 在开源社区(如 HuggingFace、GitHub)有突出贡献。
我们提供
● 顶尖资源:万卡集群算力支持,快速验证idea以及扩展scale。
● 成长体系:与行业顶级研究员共事,参与国际前沿技术探索。
● 薪酬福利:具有竞争力的薪资 + 股票激励 + 灵活工作制。
申请
LLM算法工程师
400-450元/天
上海
硕士
岗位职责
工作地点:北京/上海/杭州
团队介绍
作为蚂蚁集团的核心大模型部门,我们专注大语言模型的技术攻坚与创新突破,致力于推动通用人工智能(AGI)技术的实质性进展。团队聚焦LLM后训练方向,包括模型对齐、高阶推理、安全可控等,持续完善智能系统的认知深度与可靠性。目前部门拥有数万张显卡资源,并且仍在持续加大投入,为探索模型能力边界提供坚实的保障。在追求AGI的道路上,我们始终秉持蚂蚁集团的技术务实基因,通过扎实的底层创新推动智能技术的产业落地。
岗位职责
1. 参与大语言模型(LLM)后训练全流程优化,包括但不限于通用能力提升、安全对齐等方向。
2. 实现并应用SFT/RLHF/DPO/PPO/GRPO等算法,探索多目标奖励模型、过程监督等前沿技术,提升模型在指令遵循、逻辑推理、多任务泛化等方面的性能。
3. 构建模型效果评估体系,设计自动化评估方案,持续跟踪模型优化效果。
4. 参与技术开源与学术研究,发表顶会论文或贡献核心开源项目。
岗位要求
职位要求
● 计算机科学、人工智能、数学等相关专业硕士及以上学历(优秀本科生可放宽)。
● 熟练掌握 Python 和 PyTorch,具备分布式训练(如多机多卡调优)经验。
● 深入理解 Transformer 架构及SFT/RLHF/DPO/PPO/GRPO等算法。
● 在NeurIPS、ICML、ICLR、 ACL等顶会发表论文,或 Kaggle、ACM 竞赛获奖者优先。
加分项
● 具备大规模(千卡级)训练调优经验。
● 大规模MoE架构训练/调优经验。
● 长思维链/复杂任务推理经验。
● 在开源社区(如 HuggingFace、GitHub)有突出贡献。
我们提供
● 顶尖资源:万卡集群算力支持,快速验证idea以及扩展scale。
● 成长体系:与行业顶级研究员共事,参与国际前沿技术探索。
● 薪酬福利:具有竞争力的薪资 + 股票激励 + 灵活工作制。
申请
LLM算法工程师
400-450元/天
杭州
硕士
岗位职责
工作地点:北京/上海/杭州
团队介绍
作为蚂蚁集团的核心大模型部门,我们专注大语言模型的技术攻坚与创新突破,致力于推动通用人工智能(AGI)技术的实质性进展。团队聚焦LLM后训练方向,包括模型对齐、高阶推理、安全可控等,持续完善智能系统的认知深度与可靠性。目前部门拥有数万张显卡资源,并且仍在持续加大投入,为探索模型能力边界提供坚实的保障。在追求AGI的道路上,我们始终秉持蚂蚁集团的技术务实基因,通过扎实的底层创新推动智能技术的产业落地。
岗位职责
1. 参与大语言模型(LLM)后训练全流程优化,包括但不限于通用能力提升、安全对齐等方向。
2. 实现并应用SFT/RLHF/DPO/PPO/GRPO等算法,探索多目标奖励模型、过程监督等前沿技术,提升模型在指令遵循、逻辑推理、多任务泛化等方面的性能。
3. 构建模型效果评估体系,设计自动化评估方案,持续跟踪模型优化效果。
4. 参与技术开源与学术研究,发表顶会论文或贡献核心开源项目。
岗位要求
职位要求
● 计算机科学、人工智能、数学等相关专业硕士及以上学历(优秀本科生可放宽)。
● 熟练掌握 Python 和 PyTorch,具备分布式训练(如多机多卡调优)经验。
● 深入理解 Transformer 架构及SFT/RLHF/DPO/PPO/GRPO等算法。
● 在NeurIPS、ICML、ICLR、 ACL等顶会发表论文,或 Kaggle、ACM 竞赛获奖者优先。
加分项
● 具备大规模(千卡级)训练调优经验。
● 大规模MoE架构训练/调优经验。
● 长思维链/复杂任务推理经验。
● 在开源社区(如 HuggingFace、GitHub)有突出贡献。
我们提供
● 顶尖资源:万卡集群算力支持,快速验证idea以及扩展scale。
● 成长体系:与行业顶级研究员共事,参与国际前沿技术探索。
● 薪酬福利:具有竞争力的薪资 + 股票激励 + 灵活工作制。
申请

互联网 D轮及以上 杭州、上海、北京、深圳、重庆、新加坡等
蚂蚁集团起步于2004年诞生的支付宝,源于一份为社会解决信任问题的初心,经过十九年的发展,已成为世界领先的互联网开放平台。
我们通过科技创新,助力合作伙伴,为消费者和小微企业提供普惠便捷的数字生活及数字金融服务;
持续开放产品与技术,助力企业的数字化升级与协作;
在全球广泛合作,服务当地商家和消费者实现“全球收”、“全球付”和“全球汇”。