内推|百川智能一大模型算法工程师-急招

职位描述:

负责后训练(Post-training)相关研发工作,提升模型在数理推理、Planning、RAG、指令跟随、工具调用等方面的能力;
优化和迭代大模型的对齐训练策略和工具,包括 SFT、RLHF、Self-play RL、Agent 优化、模型融合、模型蒸馏等;
开展人类和机器偏好相关研究,提升奖励信号的质量和多样性,解决 Reward Hacking 和奖励融合问题;
参与数据飞轮、合成管道、训练实验、评测工具的开发与升级,提升团队效率,跟进并适配领域和开源的最新进展;
职位要求

计算机或数理相关专业背景,硕士或博士学历优先;
具备优秀的编程能力,精通 Linux、Python 和 Pytorch;
熟悉 Transformer 架构和大模型基础知识,有后训练及数据处理经验者优先;
具备强大的研究和实践能力,能够制定高效实验方案,快速定位和解决问题;
具有良好的沟通和协作能力,具备挑战精神和结果导向。
加分项:

在顶级会议上发表过论文并具有学术影响力。
拥有知名开源项目经验,在开源社区有影响力。
深度参与过知名大模型项目,并在关键技术上有深入实践经验。
有医学背景/医疗大模型/医疗落地实践等经验
#人工智能招聘#内推码:UHA2UC9
内推地址:https://cq6qe6bvfr6.jobs.feishu.cn/s/iA297sBh
全部评论

相关推荐

02-09 13:09
长安大学 Java
黑皮白袜臭脚体育生:简历条例统一按使用了什么技术实现了什么功能解决了什么问题或提升了什么性能指标来写 可以看看我帖子简历写法
点赞 评论 收藏
分享
01-02 00:50
三峡大学 Java
程序员牛肉:这简历一出手就离失业不远了。 作为一家公司来讲,我如果要招日常实习生,那我对实习生最基本的要求就是要能干活,毕竟你就待三四个月,谁会留心培养你? 那么除了院校之外,最重要的就是项目和实习了。没有实习的话项目就好好搞。 但是你说你这个项目吧:课程作业管理系统和TMS运输管理系统。这两个基本就和闹着玩差不多。 你作为一个想要应聘Java开发实习生的人,对后端的理解还仅仅停留在:“使用mapper和sql映射”,“使用SQL进行多表调用”,“基于MySQL简历表结构”,“基于Spring boot完成CURD操作”这种玩具上......... 找不到后端实习的
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务