岗位职责
职位描述
岗位描述:
全面负责夸克大模型在 Post-Training 能力进化和上限突破、持续推进模型能力边界和商业价值的不断延伸。通过对前沿算法的极致探索和高效能工程体系的构建,驱动模型在逻辑推理、问答、复杂多轮上下文、指令遵循、Agent 智能体、多模态交互等关键领域实现突破性进展,打造世界一流的模型效果,并定义其在未来 AI 应用中的核心价值。
工作职责:
● 【战略规划与技术引领】 制定并执行大模型 Post-training 的中长期技术路线图,预判并布局下一代对齐技术、能力增强及对齐方案。主导核心算法的战略方向,确保技术路径与公司业务战略高度协同。
● 【核心能力与壁垒构建】 领导团队进行体系化的数据驱动实验,不仅局限于日常迭代,更要建立可规模化的能力提升范式。您将攻坚并解决模型在复杂指令遵循、通用问答、RAG、深度逻辑推理、内容创作、Tool-Using 等方面的瓶颈问题,构建技术壁垒。
● 【前沿算法研究与创新】 深入探索并推动 Post-training 领域的前沿算法创新,包括但不限于 RLHF/RLAIF 的新范式、模型融合 (Model Fusion/Merge) 、模型蒸馏及 MoE 模型的高效对齐策略。您的目标是显著降低模型幻觉、提升推理的效果、加强模型复杂指令的遵循能力。
● 【多模态与未来探索】 从统一多模态模型的战略视角出发,您将指导并规划多模态统一大模型的 Post-training 技术融合。探索并落地高效的多模态 SFT 数据构建、跨模态能力协同训练及对齐策略,确保模型在图文问答、视频对话 等复杂场景下实现无缝、精准的理解与生成。
● 【团队领导与效能提升】 负责 Post-training 算法团队的组建、培养与管理,打造一支具备高效执行力和持续创新能力的顶尖团队。您将指导并优化从研究、实验、评测到部署的全链路工具链与工程框架,实现研发效能的倍增。
岗位要求
职位要求
● 计算机科学、人工智能、电子工程或相关领域的硕士或博士学位。
● 在顶级学术会议 (NeurIPS, ICML, ICLR, ACL, EMNLP 等) 发表过相关高质量论文。
● 在自然语言处理 (NLP) 或大模型 (LLM/VLM) 领域拥有 3 年以上的研发经验,对 Post-training 技术(SFT, RLHF, DPO, PPO、RLVR 等)方向拥有深厚的理论功底和业界公认的成功实践案例。
● 对深度学习和机器学习有精深的理解,尤其熟悉 Transformer、MoE 等前沿模型架构。在强化学习 (RL) 领域有扎实的理论基础,并主导过其在 LLM 中的创新应用。
● 具备卓越的工程实现能力,精通 Python 及主流深度学习框架 (PyTorch/TensorFlow)。
● 具备出色的算法设计与分析能力,能够独立设计、执行和分析复杂的模型实验。
● 具备优秀的领导力、项目管理能力和团队协作精神,能够带领团队攻克技术难关,并与算法、工程、评估等团队高效协作。
● 对前沿技术充满热情,具备出色的问题分析和解决能力,能够将研究成果有效应用于实际业务场景。