数据研发专家

薪资面议
数据其它
杭州
本科
3-5年
1 个工作日内
岗位关键词
岗位职责
为大模型应用和智能化业务提供高质量数据集 1. 在安全领域包含内容认知、流媒体、智能审标、智能凭证等场景,参与建设高质量、多样性的数据,通过数据采集、AIGC生成等技术手段不断提高数据规模 2. 深入了解数据内容,分析数据的特征,持续优化数据低质过滤、去重和增强等能力,提升数据的质量 3. 制定严格的数据质量标准,对数据进行分析和分类,评估数据质量,解决数据主题分布、内容合规、反毒性、反偏见等问题 4. 构建Data-Centric AI数据闭环,探索在固定模型和评测情况下提高数据质量的路径,包括持续优化数据质量,复现大模型数据相关论文,研究数据和模型的Scaling Law、研究数据配比、数据混入策略与混入时机 5. 围绕更具体细分类数据(如内容检测、图像理解、视频理解等)构建相应大模型的数据-训练-评测链条,并针对细分类数据建立质量评估与优化体系,促进细分类数据质量提升。
岗位要求
1. 本科学历及以上,3年及以上工作经验,人工智能、机器学习、模式识别、统计学相关专业优先 2. 较为丰富的大数据研发经验,有PB级别数据处理经验;熟悉Spark/ODPS/Ray等大数据分布式平台 3. 熟悉数据挖掘、人工智能、多模态领域的相关研究工作和实践经验,拥有发表顶会论文、大模型研究工作、知名竞赛获奖、顶级研究机构或一线互联网工作经验者优先 4. 熟练使用Python、Pytorch和CUDA等语言及工具,具备快速阅读和复现论文的能力,能够系统性对比研究领域的相关成果,并制定改进计划 5. 具备优秀的数据分析和解决问题能力,良好的团队合作精神及沟通意识 6. 具备良好的学习能力和主动性,能够跟进领域内最新技术研究成果,并结合应用场景快速实验和调优
岗位亮点
大模型、数据挖掘
蚂蚁A空间
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
蚂蚁集团
互联网
D轮及以上
杭州、上海、北京、深圳、重庆、新加坡等
查看其他 67 个职位