【校招】大模型压缩量化部署工程师(J11303)

薪资面议
北京市
2024-09-11
 什么是官网闪投?
简历直投官网 无需重复填写简历 投后必反馈 进度实时更新 安全可靠官网可查 海量岗位5w+ 移动端投递方便
岗位职责
1. 分析大模型特点,将大模型部署到对应平台,并提升模型的速度与精度表现
2. 负责开发维护高效统一的模型量化压缩及评估工具,构建领先的模型轻量化能力
3. 调研、跟踪业界最新的进展,并能在实际业务中落地

岗位要求
1. 计算机基础扎实,熟练掌握Python、C++等常见通信框架方案
2. 了解目前主流的模型及结构,熟悉VLM、LLM等模型在各个领域的应用
3. 了解模型优化加速方案,熟悉模型在线量化、离线量化、稀疏等算法原理和实现细节
4. 熟悉模型部署相关流程,如有TensorRT、QNN/SNPE等工具使用经验,熟悉其中量化相关算法与功能
5. 熟悉Pytorch等工具训练流程,熟悉其中对模型量化等相关的支持,或了解其他量化感知训练相关知识。
6. 有机器学习和视觉算法等竞赛经验优先
7. 有相关优秀开源项目经验优先
斑马网络
互联网
B轮
上海,杭州,北京,武汉,成都
查看其他 31 个职位