【快手】大模型小型化算法实习生招聘
工作岗位:快手-AI平台-大模型小型化算法实习生
工作地点:北京市海淀区西二旗中路29号元中心
岗位要求:
● 数理要求: 熟练掌握线性代数,概率论,信息论,凸优化等基础知识;了解矩阵论, 随机过程等
● 框架要求: 精通PyTorch,熟练大模型并行框架的应用,包括 DeepSpeed,Megatron-LM
● 代码要求: 精通Python
● 对模型加速的算法研究有浓厚的兴趣,特别是针对LLM和SoRA等前沿模型的推理加速探索
● 有论文发表经验优先,提供算力支持对创新idea的研究和应用
岗位职责:
● 负责快手内部AIGC大模型的推理部署效率优化需求,包括但不限于Diffusion采样时间优化,Diffusion模型的显存优化
● 负责快手内部文本及多模态大模型的推理部署效率优化需求,包括但不限于 LLM推理延时优化,LLM长文本KV-cache显存优化,LLM模型显存优化
● 跟踪前沿的模型推理高效算法进展,复现并应用于快手内部业务模型落地需求,包括但不限于投机推理,KV-cache优化算法,Diffusion Latency优化算法,模型量化,模型蒸馏,模型剪枝
联系方式:
● 欢迎感兴趣的同学投递简历至 ******************
#实习##大模型推理##推理优化##扩散模型加速#