大模型技术实习生

250-300元/天
算法工程师
上海
硕士
5天/周
最少3个月

投递时间:2024年1月26日-2024年12月31日

岗位职责
我们正在寻找对大模型算法研究充满热情的实习生,共同推动AI在大语言模型,数学建模,数学推理和发展。你将有机会深入研究强化学习,LLM、RAG和Agent等前沿技术发表高水平学术论文,并直接参与到提升我们的产品与服务的实际工作中,对技术创新和业务发展产生实质性影响。 【大模型微调方向】 岗位要求: 1.学历要求:本科学历及以上; 2.熟悉pytorch,jax基本神经网络框架,attention机制等; 3.大模型方面:熟悉大模型基础知识,包括预训练,微调,RLHF; 4.专业经验:有AI或机器学习领域的实际工作经验,包括数据分析、特征工程, 模型融合、大规模数据并行处理、分布式计算; 5.时间承诺:获得导师同意,能够保证至少3个月的实习期,每周至少3天的工作时间。 【数据合成方向】 岗位职责: 1.与项目及产品团队紧密合作,理解业务/产品背景与需求; 2.结合运筹学与大模型相关技术,构造种子数据,基于不同场景进行数据合成与扩充; 3.与其他算法工程师紧密合作,通过模型反馈改进合成数据pipeline; 4.跟进运筹优化/大模型相关技术的业界发展,并合理的运用到实际产品中; 5.对项目中使用到的算法技术进行归纳整理,完成相关技术沉淀工作。
岗位要求
任职要求: 1.运筹学/工业工程/系统工程/管理科学等专业优先; 2.熟悉各类型的运筹优化模型,如网络流、TSP、VRP、选址、排产排程等; 3.能熟练调用优化求解器及相关接口,如 CPLEX,Gurobi,SCIP 等,或完整实现过启发式算法的开发; 4.熟练掌握 Python/Java 语言,较强的数据处理能力,对JSON、XML等数据格式有基本的理解; 5.具有较强沟通能力,学习能力、自我驱动能力、责任感和团队协作能力 6.加分项,熟悉大语言模型 prompt工程。 加分项: * 有在大型语言模型或多模态模型,或强化学习相关项目经验。 * 有知名开源库的开发、贡献或维护经验。 * 在ACM、Kaggle、天池等竞赛中获奖。 加入我们,你将获得: * 计算资源: 多机多卡A100/H100。 * 有机会在高水平会议与期刊发表论文(有教授指导)。
上海市杨浦区纪念路8号财大科技园16号
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
杉数科技
数据服务
C轮
北京,上海
查看其他 4 个职位