来快star选手-2025秋招-推理优化
(杭州、北京)(实习、应届生、社招均有)
职位描述:
工作职责:
1.参与AI编译器相关项目的技术方案规划与研发,通过利用CPU、GPU、DSP以及NPU的并行计算优化、架构设计、稀疏优化和异构调度等高性能优化技术,打造行业领先的高性能异构AI推理引擎与编译器;
2.针对搜索、推荐、广告、音视频以及大模型场景,优化模型训练和推理的计算图执行效率;
3.与公司各算法部门深度合作,对重点项目进行算法与系统的联合优化。
任职资格(满足其一):
1.拥有LLVM编译工具链和优化pass等开发经验;
2.熟练掌握C++编程语言,具备扎实的数据结构与算法能力,熟悉计算机体系结构和X86汇编,熟悉Python编程;
3.熟悉XLA、MLIR、TVM、Triton、TensorRT等技术,并有相应开发经验者优先;
4.精通CPU(ARM/x86)或GPU(Intel/Nvidia/AMD)平台的高性能计算优化技术,对计算机体系结构有深入理解,熟悉移动端或服务端的并行计算优化、访存优化和低比特计算等;
5.了解深度学习算法基本原理,熟悉神经网络基本架构及其算子计算方式,了解至少一种深度学习训练框架及其模型文件解析,如Pytorch、TensorFlow;
6.具备CPU/GPU下算子Kernel开发和性能优化经验,熟悉CUDA编程;
7.具有独立解决问题的能力,能够对业务逻辑进行合理的抽象和拆分,具备良好的团队合作精神;
8.了解主流AIGC算法模型原理,具有AIGC模型加速优化经验者优先。
联系**********
#秋招##快手##腾讯##字节##阿里##校招#
职位描述:
工作职责:
1.参与AI编译器相关项目的技术方案规划与研发,通过利用CPU、GPU、DSP以及NPU的并行计算优化、架构设计、稀疏优化和异构调度等高性能优化技术,打造行业领先的高性能异构AI推理引擎与编译器;
2.针对搜索、推荐、广告、音视频以及大模型场景,优化模型训练和推理的计算图执行效率;
3.与公司各算法部门深度合作,对重点项目进行算法与系统的联合优化。
任职资格(满足其一):
1.拥有LLVM编译工具链和优化pass等开发经验;
2.熟练掌握C++编程语言,具备扎实的数据结构与算法能力,熟悉计算机体系结构和X86汇编,熟悉Python编程;
3.熟悉XLA、MLIR、TVM、Triton、TensorRT等技术,并有相应开发经验者优先;
4.精通CPU(ARM/x86)或GPU(Intel/Nvidia/AMD)平台的高性能计算优化技术,对计算机体系结构有深入理解,熟悉移动端或服务端的并行计算优化、访存优化和低比特计算等;
5.了解深度学习算法基本原理,熟悉神经网络基本架构及其算子计算方式,了解至少一种深度学习训练框架及其模型文件解析,如Pytorch、TensorFlow;
6.具备CPU/GPU下算子Kernel开发和性能优化经验,熟悉CUDA编程;
7.具有独立解决问题的能力,能够对业务逻辑进行合理的抽象和拆分,具备良好的团队合作精神;
8.了解主流AIGC算法模型原理,具有AIGC模型加速优化经验者优先。
联系**********
#秋招##快手##腾讯##字节##阿里##校招#
全部评论
社招招p7以及以下的吗?
相关推荐
JacksonWHT:我之前还觉得我双一流0offer呢,有的985也0offer,时代而已
点赞 评论 收藏
分享