【日常实习】MLP-大模型工具链工程师

薪资面议
自然语言处理
北京
本科
4天/周
最少3个月
岗位职责
【岗位信息以官网为准】参与开发和建设公司的训练、微调、评估、推理工具链,支撑公司自研大规模的分布式训练和推理应用。 参与公司内分布式训练、微调和推理任务优化,包括但不限于算子优化、通信优化和存储优化等。 参与建设和维护全面的大模型评估体系,开发和完善大模型的评估工具链,支持模型性能的持续改进。 与大模型预训练、推理以及平台等团队紧密协作,共同构建端到端的大模型能力。 跟进和探索前沿的分布式训练、微调、评估和推理技术方案,推动相应工具的不断迭代。
岗位要求
【岗位信息以官网为准】毕业时间在2025年9月1日及以后的同学(2024年9月1日-2025年8月31日之间毕业的同学请投递Shopee全职校招) 掌握计算机专业基础知识,如计算机操作系统、计算机网络、计算机组成原理等。 掌握常见的数据结构和算法,编程能力良好,能够利用计算机程序解决实际的问题。 具有良好的团队合作精神,能够与跨部门的团队紧密合作,共同推动项目的成功。 具备较强的自我驱动力和学习能力,并乐于不断尝试、追求业务突破。 加分项 熟悉常见的 CV、NLP 模型,如 ViT、GPT等 熟悉 AI 领域常见分布式训练技术的原理和实现,包括但不限于:数据并行、流水线并行和张量并行等,并具有相应的项目经验。 熟悉一种或多种深度学习框架,如 Pytorch、Tensorflow、PaddlePaddle、Deepspeed、Megatron 等,能够熟练使用并解决使用中遇到的问题。 熟悉 GPU 硬件结构和 CUDA 计算的原理,有 CUDA 相关算子开发、调试经验,对 NCCL,cuDNN 等有一定了解。 熟悉大规模预训练、微调、评估算法和流程,具有相关项目经验。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
虾皮信息
互联网
未融资
深圳市
查看其他 45 个职位