岗位职责
1. 支持多模态文档数据处理与分析,包括但不限于大模型-数据分析平台的搭建、大模型的微调和对齐,数据评测等。
2. 参与重大项目的系统搭建,包括结构化的多模态数据系统设计与开发,工具链开发与维护,针对大模型的数据闭环系统设计与开发。
3. 能够参与并解决部门多模态大模型的业务需求,包括但不限于相关的数据分析、算法落地等工程
岗位要求
1. 能够快速理解场景的需求,对目标检测、自然语言处理、多模态大模型,多模态学习等至少一个方向有深入的了解, 熟悉LLM、VLM领域常见算法,掌握CNN、Transformer结构;
2. 有算法开发和研究的经验,参与过流行开源项目研发者优先;
3. 熟练掌握 Python 和 PyTorch,有优秀的工程实现能力;
4. 能够熟练使用Linux远程服务器进行开发工作,熟悉Linux系统基本指令;
5. 在文档理解等领域利用大模型构建SFT数据处理pipeline;
6. 注意:此岗位偏工程,为日常实习岗位, 能实习4个月以上者优先