深度学习平台开发工程师(2025届校招)
薪资面议
上海市徐汇区虹梅路1801号凯科大厦2层文远知行公司/广州市黄埔区国际生物岛螺旋大道66、68、70号合景科盛广场
2024-06-18
什么是官网闪投?
简历直投官网
无需重复填写简历
投后必反馈
进度实时更新
安全可靠官网可查
海量岗位5w+
移动端投递方便
工作地点:[上海/广州]
寻找对计算机底层系统以及 AI Infra 相关技术充满热情的同学
职位概述:
- 负责 GPU 训练集群的资源管理与调度,保证 GPU 资源的高效使用
- 提升分布式训练任务的稳定性,包括开发鲁棒的训练框架以及方便易用的可视化工具等
- 提升分布式训练任务的训练效率,系统性地解决 IO/通信/运算等方向的性能问题
- 负责对接训练平台在自动驾驶数据流中的上下游,具体包括提升数据预处理的效率,提供用户友好的模型管理工具等
职位要求
- 计算机及相关专业的应届毕业生
- 熟悉 Python/Golang/C++/C 任一开发语言,并有关相关的项目经验
- 参与过社区开源项目,如 kubernetes/kubeflow/horovod 等加分
- 了解通用 GPU 架构以及业内相关虚拟化方案加分
- 了解高性能网络相关技术,对 RDMA 编程以及相关流控技术有一定的技术储备加分
- 熟练使用 Tensorflow/Pytorch 等训练框架,有 CUDA 编程经验加分
文远知行
查看其他 51 个职位