岗位职责
一、核心职责
1.文档数据解析与清洗
• 负责各类文档(包括但不限于PDF、TXT、MD、PNG等)的数据解析和清洗,确保信息的准确提取。
2.开源工具的熟练应用与优化
•深入了解并优化开源数据处理工具,掌握其在行业中的应用原则和最佳实践。
3.大模型训练支持
•参与大规模模型训练,为亿级数据提供技术支持和解决方案。
4. 行业动态的关注与分享
•持续关注文档解析与数据清洗的最新技术动态,能够独立解决或优化数据处理全链路的关键节点。
二、人才要求
• 拥有多模态、自然语言处理(NLP)、计算机视觉(CV)、人工智能(AlI)等相关领域的专业背景,经验不限,硕士博士及行业大牛优先。
• 精通大模型训练与文档数据处理的结合,熟练掌握OCR、数据清洗等开源工具的使用及其优化。
•具备出色的团队协作和沟通能力。
岗位要求
一、核心职责
1.文档数据解析与清洗
• 负责各类文档(包括但不限于PDF、TXT、MD、PNG等)的数据解析和清洗,确保信息的准确提取。
2.开源工具的熟练应用与优化
•深入了解并优化开源数据处理工具,掌握其在行业中的应用原则和最佳实践。
3.大模型训练支持
•参与大规模模型训练,为亿级数据提供技术支持和解决方案。
4. 行业动态的关注与分享
•持续关注文档解析与数据清洗的最新技术动态,能够独立解决或优化数据处理全链路的关键节点。
二、人才要求
• 拥有多模态、自然语言处理(NLP)、计算机视觉(CV)、人工智能(AlI)等相关领域的专业背景,经验不限,硕士博士及行业大牛优先。
• 精通大模型训练与文档数据处理的结合,熟练掌握OCR、数据清洗等开源工具的使用及其优化。
•具备出色的团队协作和沟通能力。