大模型推理优化工程师

薪资面议
2024-10-30
 什么是官网闪投?
简历直投官网 无需重复填写简历 投后必反馈 进度实时更新 安全可靠官网可查 海量岗位5w+ 移动端投递方便


岗位职责


1. 配合模型应用和模型训练同事,上线大模型推理服务,推动大模型相关算法的落地;

2. 持续跟进前沿技术,优化大模型推理性能,提升线上模型服务吞吐量,降低模型推理延迟,控制推理机器成本

3. 开发和优化大模型推理系统,提升模型推理系统的性能,稳定性,可观测性,易用性等

4. 使用GPU编程和系统优化手段实现高性能的推理优化算法,并将其落地于大模型推理系统中



岗位要求


1. 高性能计算,AI编译器,计算机科学,数值分析优化等相关教育背景,硕士及以上学历;

2. 熟练掌握Python,有工程开发经验,熟练掌握另一门系统级编程语言(如C++/Rust)者优先;

3. 熟悉常见的LLM推理加速框架和方法原理,如onnx/TensorRT/TensorRT-LLM/vllm/sglang,能够根据业务需求定制优化者优先;

4. 了解计算机体系结构,熟悉CPU/GPU下性能优化基本原理和方式方法,有服务端GPU程序加速经验者优先;

5. 具备CPU/GPU异构编程能力,包括但不限于CUDA, Triton,Candle等;熟悉至少一种GPU加速库,如cublas,cutlass等;

6. 熟悉分布式推理常用加速方法,有分布式系统开发经验或大模型分布式部署经验者优先;

7. 具备严谨细致的工作态度,较强的团队协作能力;

百融云创
金融
上市
北京,上海,深圳,成都,重庆,昆山
查看其他 31 个职位