【团队介绍】 百度智能云政务产品部视觉算法团队,致力于研发智慧城市场景下的多模态/视觉大模型,优化模型在长尾、跨模态、开放场景下的视觉感知能力,打造智慧城市中视觉感知全要素产品。 【工作职责】 1. 参与多模态大模型的目标检测研究,跟进并保持技术领先,研究内容包括但不限于:基于图文理解的目标检测、开放词表(open-vocabulary)目标检测等。 2. 协助团队进行多模态大模型的数据集构建、方法验证和业务落地,针对智慧城市全场景视觉业务优化大模型能力。 3. 对于表现优秀的同学,可进行顶会论文的投稿。 【岗位要求】 1. 计算机或相关专业本科大三及以上,在读研究生优先(研究生导师知...