阿里巴巴-训练引擎内核优化-智能引擎-训练

薪资面议
深度学习
北京
本科
1-3年
1 个工作日内
岗位关键词
岗位职责
职位描述 我们关注模型训练系统,为深度学习模型训练提供算力基座,包括但不限于以下职责: 1. 通过分布式并行/流水线/通信优化,消除大规模分布式训练瓶颈。 2. 通过编译优化/专家优化,释放CPU/GPU/NPU等异构硬件协同最大算力。 3. 结合算法逻辑,探索适合业务的创新训练范式。
岗位要求
职位要求 1. 有扎实的工程算法基础,精通数据结构和常用算法,熟练掌握各种编译、调试、性能分析工具 2. 有极佳的工程实现能力,精通C/C++、Python 3. 熟悉pytorch/tensorflow框架优先 4. 熟悉cuda编程、RDMA高性能网络通信、TVM/XLA编译优化优先 5. 勤于动手,善于动脑,乐于挑战的同学优先
望京
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报