25届校招-算法研究员

薪资面议
中国/北京市/海淀区/西二旗中路33号小米科技园D栋/小米武汉总部大楼2号门
2024-09-14
 什么是官网闪投?
简历直投官网 无需重复填写简历 投后必反馈 进度实时更新 安全可靠官网可查 海量岗位5w+ 移动端投递方便


岗位职责

-跟踪前沿研究,负责大语言模型整体训练工作中的一项,包括但不限于预训练、指令微调与对齐

-深入数据,构建可迁移的高效训练数据方案,能有效进行数据工程,不断迭代优化数据质量方法论,包含但不限于人工合成数据方法与高效数据筛选

-跟踪评测,打造高效可迁移的评测方法论,完整基座模型、对话模型与领域模型的评测闭环



任职要求

-熟悉LLAMA3、Qwen2等开源SOTA大模型结构,具备高效微调、继续预训练的成功经验,熟悉Megatron、FSDP等大模型训练框架

-深入了解TransformerDecoder-only等深度网络理论,具备扎实的大模型训练(多机多卡)基础与经验

-具备丰富的数据方法论,包括数据清洗、去重、过滤的实际经验,对数据质量有独到深入的理解

-设计并落地过数据质量筛选指标或模型者优先。

-在AI领域顶级会议上发表过关于大模型相关研究成果者优先。