美团算法一面

📍面试公司:美团

👜面试岗位:大模型春招

📖面试问题:

  1. 问了 PPO 重要性采样系数怎么才能为1?调节批量,学习率,超参数啥的 不懂,策略收敛最优解不就为一了吗
  2. grpo 的 GAE 怎么算,和批量大小有没有关系?为啥没有要PPO的v函数?
  3. 离轨策略和在线策略的关系?
  4. 冷启动 + grpo 怎么做的?
  5. 仿真寻优(实习项目)的 PPO 和 openai 的PPO有啥不同? 项目的p(s'|s,a)=1,状态转移矩阵非常稀疏

    手撕链表 切断+翻转+链表合并

    Input: 1->2->3->4->5->6->7

    Output: 1->7->2->6->3->5->4

    写了蛮久,一开始暴力求解,绕晕了。。果断转换思路,勉强做出来了

🙌面试体验:因为很早,校招通道没开,走的实习面试流程。

虽然我实习是RL岗位,但他确实没问什么llm的面经题和transformer还蛮意外的

除了第一问调参经验少了,基本答上了,大半周后拿到二面了

#美团##算法岗面试#
全部评论
太强了
点赞 回复 分享
发布于 03-25 00:05 广东

相关推荐

11-19 18:44
已编辑
成都理工大学 Java
程序员花海:我面试过100+校招生,大厂后端面试不看ACM,竞赛经历含金量低于你有几份大厂实习 这个简历整体来看不错 可以海投
如何写一份好简历
点赞 评论 收藏
分享
12-06 01:10
已编辑
哈尔滨工程大学 Java
一面问的真细,二面不知为啥变双机位。9.29快手主站平时怎么学习 AI 的,国内外知名大模型,实习公司都用的什么大模型,怎么评估效果的java池化思想,线程池构造方法的核心参数,线程池中阻塞队列注意事项,submit方法参数和执行逻辑,shutdown和shutdownnow,核心线程允许过期吗threadlocal底层,为什么key是弱引用,key回收了再get或者set这个value会怎样aqs,如何保证公平性java代理java堆划分,新生代还有别的晋升老年代的情况吗,什么时候触发gc,gc失败抛什么异常,如何排查oom,导出dump命令redis数据结构,哪个底层是跳表,和其他数据结构对比布隆过滤器会出现大key问题吗,你咋实现的布隆过滤器你怎么实现redis分布式锁,可重入,续期聚簇索引非聚簇索引select语句会加锁吗,怎么实现的不加锁undolog redolog binlog怎么能让select加锁,update这个范围加的什么锁,update一条呢手撕简单01背包,接雨水10.10快手主站意图识别用的哪个大模型,走到意图和rag的比例,faq是点击的吗自然语言怎么识别的gap一年干啥了,转正怎么样没跟组里提意向吗,研究生研究方向是传统算法吗,会大模型微调吗注册场景为什么用布隆过滤器,原理分布式锁底层的key怎么拼的,value里是什么redis持久化zset底层mysql索引结构,一个表三个字段有主键唯一索引和没索引的字段会有几个b+树,聚簇索引非聚簇索引存的啥无手撕
点赞 评论 收藏
分享
评论
1
13
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务