李先生
北京快手科技有限公司·开发
---
上次在线
86%
反馈率
4天
处理时长
在招职位 (4)
AI编译器
350-450元/天
北京
本科
岗位职责
工作职责:
1.参与AI编译器相关项目的技术方案规划与研发,通过利用CPU、GPU、DSP以及NPU的并行计算优化、架构设计、稀疏优化和异构调度等高性能优化技术,打造行业领先的高性能异构AI推理引擎与编译器;
2.针对搜索、推荐、广告、音视频以及大模型场景,优化模型训练和推理的计算图执行效率;
3.与公司各算法部门深度合作,对重点项目进行算法与系统的联合优化。
岗位要求
任职资格:(满足其中一个)
1.拥有LLVM编译工具链和优化pass等开发经验;
2.熟练掌握C++编程语言,具备扎实的数据结构与算法能力,熟悉计算机体系结构和X86汇编,熟悉Python编程;
3.熟悉XLA、MLIR、TVM、Triton、TensorRT等技术,并有相应开发经验者优先;
4.精通CPU(ARM/x86)或GPU(Intel/Nvidia/AMD)平台的高性能计算优化技术,对计算机体系结构有深入理解,熟悉移动端或服务端的并行计算优化、访存优化和低比特计算等;
5.了解深度学习算法基本原理,熟悉神经网络基本架构及其算子计算方式,了解至少一种深度学习训练框架及其模型文件解析,如Pytorch、TensorFlow;
6.具备CPU/GPU下算子Kernel开发和性能优化经验,熟悉CUDA编程;
7.具有独立解决问题的能力,能够对业务逻辑进行合理的抽象和拆分,具备良好的团队合作精神;
8.了解主流AIGC算法模型原理,具有AIGC模型加速优化经验者优先。
申请
AI编译器
350-450元/天
杭州
本科
岗位职责
工作职责:
1.参与AI编译器相关项目的技术方案规划与研发,通过利用CPU、GPU、DSP以及NPU的并行计算优化、架构设计、稀疏优化和异构调度等高性能优化技术,打造行业领先的高性能异构AI推理引擎与编译器;
2.针对搜索、推荐、广告、音视频以及大模型场景,优化模型训练和推理的计算图执行效率;
3.与公司各算法部门深度合作,对重点项目进行算法与系统的联合优化。
岗位要求
任职资格:(满足其中一个)
1.拥有LLVM编译工具链和优化pass等开发经验;
2.熟练掌握C++编程语言,具备扎实的数据结构与算法能力,熟悉计算机体系结构和X86汇编,熟悉Python编程;
3.熟悉XLA、MLIR、TVM、Triton、TensorRT等技术,并有相应开发经验者优先;
4.精通CPU(ARM/x86)或GPU(Intel/Nvidia/AMD)平台的高性能计算优化技术,对计算机体系结构有深入理解,熟悉移动端或服务端的并行计算优化、访存优化和低比特计算等;
5.了解深度学习算法基本原理,熟悉神经网络基本架构及其算子计算方式,了解至少一种深度学习训练框架及其模型文件解析,如Pytorch、TensorFlow;
6.具备CPU/GPU下算子Kernel开发和性能优化经验,熟悉CUDA编程;
7.具有独立解决问题的能力,能够对业务逻辑进行合理的抽象和拆分,具备良好的团队合作精神;
8.了解主流AIGC算法模型原理,具有AIGC模型加速优化经验者优先。
申请
推理优化
300-450元/天
杭州
本科
岗位职责
工作职责:
1.参与AI编译器相关项目的技术方案规划与研发,通过利用CPU、GPU、DSP以及NPU的并行计算优化、架构设计、稀疏优化和异构调度等高性能优化技术,打造行业领先的高性能异构AI推理引擎与编译器;
2.针对搜索、推荐、广告、音视频以及大模型场景,优化模型训练和推理的计算图执行效率;
3.与公司各算法部门深度合作,对重点项目进行算法与系统的联合优化。
岗位要求
任职资格:(满足其一)
1.拥有LLVM编译工具链和优化pass等开发经验;
2.熟练掌握C++编程语言,具备扎实的数据结构与算法能力,熟悉计算机体系结构和X86汇编,熟悉Python编程;
3.熟悉XLA、MLIR、TVM、Triton、TensorRT等技术,并有相应开发经验者优先;
4.精通CPU(ARM/x86)或GPU(Intel/Nvidia/AMD)平台的高性能计算优化技术,对计算机体系结构有深入理解,熟悉移动端或服务端的并行计算优化、访存优化和低比特计算等;
5.了解深度学习算法基本原理,熟悉神经网络基本架构及其算子计算方式,了解至少一种深度学习训练框架及其模型文件解析,如Pytorch、TensorFlow;
6.具备CPU/GPU下算子Kernel开发和性能优化经验,熟悉CUDA编程;
7.具有独立解决问题的能力,能够对业务逻辑进行合理的抽象和拆分,具备良好的团队合作精神;
8.了解主流AIGC算法模型原理,具有AIGC模型加速优化经验者优先。
申请
推理优化
300-450元/天
北京
本科
岗位职责
工作职责:
1.参与AI编译器相关项目的技术方案规划与研发,通过利用CPU、GPU、DSP以及NPU的并行计算优化、架构设计、稀疏优化和异构调度等高性能优化技术,打造行业领先的高性能异构AI推理引擎与编译器;
2.针对搜索、推荐、广告、音视频以及大模型场景,优化模型训练和推理的计算图执行效率;
3.与公司各算法部门深度合作,对重点项目进行算法与系统的联合优化。
岗位要求
任职资格:(满足其一)
1.拥有LLVM编译工具链和优化pass等开发经验;
2.熟练掌握C++编程语言,具备扎实的数据结构与算法能力,熟悉计算机体系结构和X86汇编,熟悉Python编程;
3.熟悉XLA、MLIR、TVM、Triton、TensorRT等技术,并有相应开发经验者优先;
4.精通CPU(ARM/x86)或GPU(Intel/Nvidia/AMD)平台的高性能计算优化技术,对计算机体系结构有深入理解,熟悉移动端或服务端的并行计算优化、访存优化和低比特计算等;
5.了解深度学习算法基本原理,熟悉神经网络基本架构及其算子计算方式,了解至少一种深度学习训练框架及其模型文件解析,如Pytorch、TensorFlow;
6.具备CPU/GPU下算子Kernel开发和性能优化经验,熟悉CUDA编程;
7.具有独立解决问题的能力,能够对业务逻辑进行合理的抽象和拆分,具备良好的团队合作精神;
8.了解主流AIGC算法模型原理,具有AIGC模型加速优化经验者优先。
申请
快手
互联网 已上市 北京(总部)
快手,成立于2011年,是一款国民级短视频App。作为普惠的数字社区,快手不仅让数亿普通人记录和分享生活,更帮助人们发现所需、发挥所长。同时快手拥有行业领先薪酬和福利,欢迎大家加入!