内推|百川智能一大模型算法工程师-急招

职位描述:

负责后训练(Post-training)相关研发工作,提升模型在数理推理、Planning、RAG、指令跟随、工具调用等方面的能力;
优化和迭代大模型的对齐训练策略和工具,包括 SFT、RLHF、Self-play RL、Agent 优化、模型融合、模型蒸馏等;
开展人类和机器偏好相关研究,提升奖励信号的质量和多样性,解决 Reward Hacking 和奖励融合问题;
参与数据飞轮、合成管道、训练实验、评测工具的开发与升级,提升团队效率,跟进并适配领域和开源的最新进展;
职位要求

计算机或数理相关专业背景,硕士或博士学历优先;
具备优秀的编程能力,精通 Linux、Python 和 Pytorch;
熟悉 Transformer 架构和大模型基础知识,有后训练及数据处理经验者优先;
具备强大的研究和实践能力,能够制定高效实验方案,快速定位和解决问题;
具有良好的沟通和协作能力,具备挑战精神和结果导向。
加分项:

在顶级会议上发表过论文并具有学术影响力。
拥有知名开源项目经验,在开源社区有影响力。
深度参与过知名大模型项目,并在关键技术上有深入实践经验。
有医学背景/医疗大模型/医疗落地实践等经验
#人工智能招聘#内推码:UHA2UC9
内推地址:https://cq6qe6bvfr6.jobs.feishu.cn/s/iA297sBh
全部评论

相关推荐

( 发的有点晚,上个月面的面试官属于慢慢引导你的那种,气氛很融洽;hr也很热心;公司第一印象宽敞且舒适问的问题:0. 把我当成小白,给我讲一个你觉得做的比较好的项目讲的是自己做的那个大模型RAG应用,但是实际上讲的比较混乱,重新梳理后核心就这几个东西- Prompt:提问 & 提示词- Embedding:词嵌入- similarity_research:向量匹配- Rerank:结果过滤追问:Embedding的过程具体起到什么用答的不好1. Embedding 过程实际上是将高维、离散的数据映射到低维、连续的向量空间中。这种映射旨在保持数据在原始空间中的相似性,使得在向量空间中相近的嵌入向量表示的数据在原始空间中也是相似的。2. 过程a. 初始化首先,需要定义嵌入向量的维度(即每个数据点将被映射到的向量的大小)。然后,通常随机初始化一个嵌入矩阵,其行数等于数据集中唯一数据点的数量,列数等于嵌入向量的维度。b. 学习在训练过程中,嵌入矩阵是通过优化一个目标函数来学习的。这个目标函数通常与任务相关,比如在推荐系统中,可能希望相似的物品有相近的嵌入向量。通过梯度下降等优化算法,模型会更新嵌入矩阵中的权重,使得相似的输入数据在嵌入空间中靠近,而不相似的则远离。c. 优化在学习过程中,可能会应用一些技巧来改善嵌入的质量,如使用负采样、正则化、dropout等。d. 应用一旦嵌入向量被学习好,它们就可以用于各种下游任务,比如文档相似度计算、推荐系统、图像分类等。1. http和https的区别,https相比于http,安全性体现在哪方面没复习,就记得ssl和ca了区别:- 加密:http不加密,使用明文传输;https使用ssl和tls加密- 认证:https通过证书验证服务器身份- 端口:80,443安全性:- https采用对称加密和非对称加密结合的方式- https采用CA验证服务器身份- 通过hash或mac(消息认证码)来保证数据完整性- 序列号机制,防止重复信息的发送2. 浏览器缓存没复习到,忘了强缓存:浏览器直接使用本地缓存,不与服务器交互,直到缓存过期。(字段:Expires,Cache-Control)协商缓存:浏览器每次请求资源都会与服务器进行通信,通过对比资源的修改状态来决定是否使用缓存。(字段:Last Modified,Etag)3. 为什么项目使用JWT而不使用Sessions作为认证?当时设计时没考虑到JWT组成:- head,通过base64编码- payload,指定算法加密- signature,指定密钥JWT的特点:无状态,无需储存在服务器中,但是需要进行解码运算,跨域支持好;适合频繁认证的场景Session的特点:存储于服务器,有状态;灵活性高,可以随时删除,跨域支持一般;适合低频认证、需要高安全性的场景4. tailwind对性能优化体现在什么方面按打包方面发挥了,这方面没做过功课有三个方面:浏览器:JIT辅助开发打包:purge、tree-shaking等减少打包体积开发:减少重复代码的书写、减少记忆成本5. 按输入监听即时查询的输入框和鼠标点击搜索才进行查询的输入框你认为他们各自在什么场景更合适憋了一会,答的是三个因素- 搜索条件数量与复杂度- 搜索词与匹配词之间的匹配精确/模糊程度- 服务器性能开销查了查还有其它方面可以说- 用户体验(用户习惯 / 搜索体验 / 搜索效率 / 用户辅助-即时搜索与自动补全)- 安全性(即时搜索会暴露更多的数据)6. 讲讲你对闭包的理解7. 讲一讲http接口(get,post)非技术上,面试官给我的建议(主要是自己比较紧张- 手部动作有点多- 声音可以适当放大一点我个人感觉到的自己的问题- 逻辑角度讲的有些多,往后才慢慢回到技术角度我整体上答得都一般,但是面试体验很好Update:应该是被刷KPI了,快一个月没消息了,这也让我反思了一下随意和融洽这两个词的区别目前已入职另一家公司
查看9道真题和解析
点赞 评论 收藏
分享
点赞 收藏 评论
分享
牛客网
牛客企业服务