高性能计算研发工程师
30-60K * 16薪
C++ 北京 硕士 1-3年
岗位关键词
岗位职责
工作职责
我们致力于构建全球领先的AI异构计算加速引擎和加速平台。建立融合推理(Inference)、训练(Training)的软硬件一体的AI计算加速解决方案,并应用于行业最大的规模的AI数据中心,解决云计算、搜索、信息流、图像、视觉、语音、自然语言处理等的算法优化与计算加速问题。
-负责大规模AI前向计算引擎(Inference Engine)框架和底层算子开发与优化
-负责大规模AI计算通信库及通信算法开发与优化
-负责面向CPU/GPU/FPGA/ASIC等多元化计算架构的编译系统开发、编译优化和算法加速
-负责异构高性能计算平台的设计、研发,高性能计算库、通信库开发与优化
岗位要求
任职资格
精通以下一项或多项专业技能,或在相关领域具备丰富经验
专业技能:
-热爱编程,精通C++/Python
-具有独立开发能力,对AI算法和主流框架有丰富的应用或开发经验
-精通GPU/ARM/MIPS/DSP等任意异构计算平台
-精通计算机体系结构,有汇编级别开发经验
-精通GPU/ARM/MIPS/DSP等异构计算平台的通信库
-精通MPI,对不同网络拓扑结构的通信算法及底层通信函数有深入研究,对RDMA,GPU direct等技术有了解
-对分布式计算有深入理解,特别是同步,异步等通信策略在AI计算中的应用
软素质:
-目标驱动,并有探索精神
-团队协作及沟通能力
-具备分析和解决问题的能力
-有极强的学习能力和知识迁移能力
具有以下条件者优先:
-精通PaddlePaddle、Caffe/Caffe2、MXNET、TensorFlow等开源框架,做过源码级优化移植等工作
-熟练使用Cublas、Cudnn、MIopen、OpenBlas、MKL、Eigen等主流计算库
-熟悉AI training通信过程,熟悉MPI,NCCL,RDMA,GPU Direct等通信技术
-精通CUDA/OpenCL开发,有SASS或PTX级别优化开发经验
-精通Neon或ARM-GPU开发,有过大小端并行计算优化经验及ARM-GPU协同开发经验
-精通常用硬件平台性能分析工具链,如CodeXL\NVVP\GPA等
-精通LLVM
-有Linux内核相关开发和优化经验
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报