百度大模型分布式训练研发工程师校招、社招

岗位JD
大模型分布式训练研发工程师
工作职责
-参与负责百度文心大模型的训练优化和支持
-负责百度核心产品飞桨的分布式训练功能和架构开发
-参与前沿大模型训练技术和超大规模分布式训练架构技术的探索和研究
-参与飞桨深度学习框架的优化工作,使开发者能够以更简单的方式实现各类任务,降低学习成本和开发成本
-负责异构高性能计算平台的设计、研发,高性能计算库、通信库开发与优化
-探索深度学习NLP,CV等领域的算法-工程协同优化方案
-根据整体技术方案完成高质量的开发、自测及项目文档编写
职责要求
-热爱大模型训练技术或者深度学习框架技术
-计算机软件或相关专业硕士及以上学历
-有Linux/Unix下开发经验,熟悉多线程编程、网络编程
-熟悉大模型训练技术或优化技术大模型性能优化和分布式训练技术方向存在较大人力缺口(主要缺乏T3-T4级别左右的研发主力),因此申请发布社招需求补充相关人力。从而支持后续业务发展需要,熟悉CUDA编程,高性能优化者优先
-了解飞桨或其他深度学习分布式训练框架技术如DeepSpeed,Megatron等或者有云原生、微服务架构经验者优先
-优秀的分析问题和解决问题的能力,对解决具有挑战性问题充满激情
-思路清晰,具备良好的沟通能力和理解能力
-工作积极主动,具有强烈的责任心
-良好的团队合作精神

请私聊我。
全部评论

相关推荐

华为校招!!大模型方向!!欢迎联系岗位职责: 先进 AI 作业工具和平台,面向各种业务模型和各类大模型,支持华为数万研发人员的模型训练、微调、推理、加速等整个开发活动。技术方向:1.AI方向:面向行业 AI 使能创新场景,研究和快速实现 AI 相关框架、模型算法和适配、优化和增强。支持模型的训练加速和昇腾适配,支持百级千卡对超大数据量数据的训练。2.数据方向:利用数据挖掘、数据清洗、特征工程、神经网络等技术,智能分析海量数据,设计和实现适配于行业模型的全套数据加工流程3.分布式系统方向:研究和实现高可用、高性能分布式系统,具备弹性扩容、无损升级、异地容灾、海量并发等功能,达成业界一流水平4.WEB全栈+工业化方向:工程化 AI 技术方案,深入研发业务,建设研发中台服务,实现业界先进技术( AI 技术、大数据技术、云技术等)的平台化,使用 react 、 vue 、 python 、 java 、 c ++等工程序言建设最佳的业界先进平台,提供最佳用户体验岗位要求:1.计算机、软件、通信等相关专业本科及以上学历2.掌握一种编程语言包括但是不限于 Python 、 Java 、 Go 、 Javascript 、 Vue 、 C / C ++、 Rust 3.具备较强的独立工作能力,善于解决问题,有团队合作精神,有责任心
投递华为等公司10个岗位
点赞 评论 收藏
分享
点赞 收藏 评论
分享
牛客网
牛客企业服务