工作内容:百度视觉技术部视觉垂类应用组专注于多模态大语言模型的研发与应用落地,核心聚焦于提升模型推理部署的性能优化。1)加速算法研发:负责开发并创新多模态大语言模型的加速策略,包括但不限于剪枝、蒸馏、并行解码等前沿技术,确保算法的领先性与实用性。2)推理性能优化:通过Cache优化、编译技术、子图融合、高效并行计算及量化推理等手段,显著提升大模型的实时推理性能,构建行业领先的推理引擎。3)业务支撑与部署:与公司内部各业务部门紧密合作,为各类视觉产品线提供技术支持,解决推理性能瓶颈,降低成本,推动多模态大语言模型的高效部署与应用。职位要求:1)教育背景:计算机科学或相关专业硕士研究生及以上学历(...