深度学习推理优化工程师-社区技术【处理快】

薪资面议
C++
北京
本科
3-5年
岗位关键词
岗位职责
1、支持搜推业务场景高效接入模型推理服务,并通过算子融合、模型压缩、量化等手段优化现有模型推理性能 2、支持CV/NLP内容理解场景高效接入模型推理服务,并通过算子融合、模型压缩、量化等手段降低推理成本 3、对transformer、LLM等模型进行深度优化,满足性能和成本要求 4、设计并实现高效的分布式离线推理方案,支持高效的离线批量模型推理
岗位要求
1、熟练掌握C/C++,具有良好的工程能力、编程习惯、以及沟通能力 2、熟悉 tensorflow/pytorch等训练推理框架,掌握GPU 的高性能计算优化技巧 3、大于2年的推理优化领域工作经验,有搜广推模型服务推理优化经验者优先;深入了解Transformer、LLM 模型者优先 4、对ray有开发、使用经验者优先 5、自驱能力强,有想法,敢于实践 工作地点: 北京市,上海市 工作经验: 不限 学历要求: 本科及以上
岗位亮点
部门直招,处理快,全程跟进
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报