大模型推理内存优化

200-400元/天
机器学习
杭州
硕士
5天/周
最少3个月
有转正
岗位关键词
岗位职责
岗位职责 参与及负责大模型推理引擎的系统和架构设计。 参与深度优化大模型推理引擎的性能,包括提高吞吐与降低延时。 推进对用户query的处理
岗位要求
1. 硕士及以上,具备机器学习经验基础,熟悉常见机器学习、深度学习算法,熟悉机器学习框架,比如Pytorch 2. 有CPU、GPU优化的经验 3. 对大模型推理内存管理有了解,比如flashattention等 以下是加分项: 1. 有对推理框架的内存管理有研发经验 2. 有对分布式训练或者推理优化相关的研究 3. 有在顶会顶刊发表文章
五常街道同顺街18号
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报