【校招】大模型压缩量化部署工程师(J11303)

25-40K * 15薪
算法工程师
北京
硕士

投递时间:2024年9月27日-2025年10月1日

岗位职责
1. 分析大模型特点,将大模型部署到对应平台,并提升模型的速度与精度表现 2. 负责开发维护高效统一的模型量化压缩及评估工具,构建领先的模型轻量化能力 3. 调研、跟踪业界最新的进展,并能在实际业务中落地
岗位要求
1. 计算机基础扎实,熟练掌握Python、C++等常见通信框架方案 2. 了解目前主流的模型及结构,熟悉VLM、LLM等模型在各个领域的应用 3. 了解模型优化加速方案,熟悉模型在线量化、离线量化、稀疏等算法原理和实现细节 4. 熟悉模型部署相关流程,如有TensorRT、QNN/SNPE等工具使用经验,熟悉其中量化相关算法与功能 5. 熟悉Pytorch等工具训练流程,熟悉其中对模型量化等相关的支持,或了解其他量化感知训练相关知识。 6. 有机器学习和视觉算法等竞赛经验优先 7. 有相关优秀开源项目经验优先
阿里中心北京朝阳科技园
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
斑马网络
互联网
B轮
上海,杭州,北京,武汉,成都
查看其他 9 个职位