美团基础研发 大模型算法工程师实习面经

一面

  • 自我介绍
  • 项目+论文
  • 为啥项目中使用Ptuning?
  • 说一下Ptuning的原理
  • 如何关注训练过程中的指标? 训练步数如何确定?
  • RLHF的整个流程详细
  • llama factory代码看过吗?
  • DPO了解吗?
  • 算法题 二分,medium, 旋转数组的最小数字

二面

二面面试官问了很多开放性问题,就是丢给你一个一个问题/实际的步骤,问你怎么解决,怎么考虑,而不是问某某东西的原理

  • 自我介绍
  • 项目
  • 训练大模型的数据如何弄的?
  • RLHF的三个流程中你觉得哪个应该是最重要的?为什么?
  • 为啥RLHF中要用PPO?和其他RL算法的区别?
  • 为什么需要Rewar model?
  • Reward model 如何训练?Reward model 你觉得训练到什么程度可以?
  • Reward model不准确怎么办?
  • 如何提升RLHF的效率?你认为关键在哪里?
  • DPO的原理?
  • Rewar model和训练的LLM模型用同一个基座模型可能有什么作用?
  • Reward有多个目标可以怎么做?
  • 算法题 爬楼梯 面试官会引导逐步改善最开始写的解优化算法到最优空间复杂度
#面经##美团##大模型#
全部评论
佬是项目里用了RLHF吗
3 回复 分享
发布于 2024-03-25 09:16 江苏
Reward model 如何训练?Reward model 你觉得训练到什么程度可以?Reward model不准确怎么办?Rewar model和训练的LLM模型用同一个基座模型可能有什么作用?这几个问题 佬怎么回答的啊
点赞 回复 分享
发布于 2024-04-06 14:43 广东

相关推荐

介绍项目,其中使用的技术和框架sentinel,问为什么要限流?具体设定的QPS?为什么使用RecketMQ进行削峰?通过什么途径学习技术和框架?手撕题目第k大元素链表反转然后开始问了点八股==和equals的区别?ArrayList和LinkedList的区别?具体使用场景。IoC和AOP了解过吗?事务注解使用注解的时候有什么注意事项?Mysql的索引结构?为什么不用B树?HashMap是线程安全吗?为什么不是线程安全的?比如说多线程情况下使用HashMap会有什么问题?线程池了解吗?熟悉什么设计模式?答了单例 工厂 代理 装饰器,问装饰器模式,答了项目里的具体使用,然后问为什么使用单例模式,什么情况下用单例?什么情况不用单例?JVM涉及什么参数?比如你项目部署到JVM里要配置什么参数?(不知道)锁答了自己项目的redisson读写锁,什么情况下会用?项目使用什么IO建立连接,阻塞还是非阻塞的?(不太清楚,感觉做的时候没涉及过)你做项目的时候遇到什么困难,然后如何解决?你的项目在什么情况下使用分布式锁?分布式事务后面就尬聊了5-6分钟对最近比较火的大模型怎么看?学的密码学,为什么去做开发?看过隐私计算吗?答了联邦学习和多方安全没了,反问我问能不能给我提一点建议,比如简历上的,或者评价一下我目前在面试人里处于一个什么水平?#牛客AI配图神器#
美团一面1929人在聊 查看26道真题和解析
点赞 评论 收藏
分享
评论
13
88
分享

创作者周榜

更多
牛客网
牛客企业服务