25届校招-算法研究员
薪资面议
中国/北京市/海淀区/西二旗中路33号小米科技园D栋/小米武汉总部大楼2号门
2024-09-14
什么是官网闪投?
简历直投官网
无需重复填写简历
投后必反馈
进度实时更新
安全可靠官网可查
海量岗位5w+
移动端投递方便
岗位职责
-跟踪前沿研究,负责大语言模型整体训练工作中的一项,包括但不限于预训练、指令微调与对齐
-深入数据,构建可迁移的高效训练数据方案,能有效进行数据工程,不断迭代优化数据质量方法论,包含但不限于人工合成数据方法与高效数据筛选
-跟踪评测,打造高效可迁移的评测方法论,完整基座模型、对话模型与领域模型的评测闭环
任职要求
-熟悉LLAMA3、Qwen2等开源SOTA大模型结构,具备高效微调、继续预训练的成功经验,熟悉Megatron、FSDP等大模型训练框架
-深入了解TransformerDecoder-only等深度网络理论,具备扎实的大模型训练(多机多卡)基础与经验
-具备丰富的数据方法论,包括数据清洗、去重、过滤的实际经验,对数据质量有独到深入的理解
-设计并落地过数据质量筛选指标或模型者优先。
-在AI领域顶级会议上发表过关于大模型相关研究成果者优先。