2024-10-10 18:23 已编辑门头沟学院算法工程师发布于北京

关注

元象大模型算法面经

不怎么发面经，但是元象的面试体验是目前面过所有的公司体验最好的，所以写出来分享一下

更新 ——————————————

9.30 二面
10.08 HR面（系统里写的联创面，以为是联合创始人面，结果是HR面）
HR很真诚，说不养鱼，很快谈薪

————————————————
大模型应用组：（面的时间比较早好些问题忘了）
8.24 投递
9.13 一面 30min
- 深挖实习
- deepspeed原理
- LoRA原理
- LN的作用
- 为什么LN能使模型训练更稳定
- 无手撕
9.19 二面挂 30min
- 全程深挖我的实习经历，无八股无手撕（面试官一直解释说是想鸡蛋里挑骨头，挺实诚的，行吧

）

9.23 被大模型研发组捞

9.25 刚一面完

1h：
- 深挖实习
- deepspeed原理
- deepspeed和以往张量并行的区别
- transformer结构
- 拷打多头注意力（为什么多头更好，能不能单头）
- Llama相对于Transformer decoder的改进点
- RMSNorm和LN的区别
- prenorm和postnorm的区别
- 模型训练时显存占用（优化器，梯度，激活值等都怎么估计，假设模型7b）
- 序列并行的原理
- 介绍一下位置编码（和面试官讨论了RoPE和NTK系列的位置编码）
- RoPE为什么能够表示相对位置
- RoPE怎么作用的，如何旋转（我说完后面试官从数学角度补充了他的理解，鼠鼠受益良多

）
- VLLM原理
- 为什么需要KV-cache
- “写个题呗，简单点的，反转链表吧”

这三场面试的面试官都很有礼貌。尤其刚面完的这场，面试官基础和技术都很强，感觉他没少看苏神博客，对原理拷打的很细致

。很多问题我说完之后他会补上自己的理解和我讨论，不像是在面试哈哈哈。但是也感觉自己的所有积累也被他翻了个底朝天，收获很多

，许愿一个二面～

全部评论

推荐最新楼层

sam阿尔特曼

中国戏曲学院动画设计

hr 面和谈薪隔了多久呀我也在排序呢

点赞回复分享

发布于 2024-10-13 19:34 北京

东南大学算法工程师

楼主谈薪完是发意向还是签两方？

点赞回复分享

发布于 2024-10-17 19:24 广东

上海第二工业大学自然语言处理

萌新提问：苏神是。。。

点赞回复分享

发布于 01-04 00:25 上海

03-16 13:43

门头沟学院算法工程师

百度-文心一言-一面面经

情况:面完一面过了一周，HR直接发了OFFER，没有二面，已ocPPO与GRPO的区别，分别介绍他们的优势与缺点DPO对齐训练的曲线是怎么样的，正例的概率会提升嘛,参考这个知乎回答:Deepseek-R1里面不仅推理能力很好，而且文采能力也很好，这个是个开放问题，如何让模型的文采能力也很好呢？介绍你在实习做的事情，有遇到什么case嘛，怎么解决的deepseed介绍deepspeed的每一段的通信比较，zero3分别是0和2的多少倍，1.5倍DPO如何解决回答过长的问题，除了正则开放问题：为什么现在大家都在关注于大模型的推理能力reasoning对于一个base model如何增强大模型的re...

查看12道真题和解析技术岗笔试题求解

点赞评论收藏

分享

03-20 00:31

Imperial College London 算法工程师

找个ai应用/ai算法友友交流经验

有没有同是找大模型应用的友友 暑期春招都可以 做RAG, SFT, agent等等这些的，想认识一下大家，交流经验！！！#牛客AI配图神器##算法##春招##暑期##大模型应用##大模型##实习##面经#

点赞评论收藏

分享

03-13 18:29

南京大学算法工程师

大模型面经 - 腾讯混元

面试经验分享

点赞评论收藏

分享

02-25 23:06

北京师范大学 Python

美甲大模型实习面经（一面）

🔞 美甲🧑‍🔧 语音算法实习😶‍🌫️ 项目提问+八股1. 自我介绍2. 介绍一下简历上的大模型项目；讲一讲如何做数据清理的；角色知识增强是怎么做的；推理阶段有无优化；有没有最新的改进。3. 介绍一下现在的研究方向以及论文。（主要听听思路，由于我说借鉴了RLHF的思路，借机问了一下RLHF的技术框架）4. LoRA的原理；RLHF的细节（要求更细致的介绍，这里问了一个我不是很理解的问题，除了reward model和llm，还用到了什么模型？之后查了一下确实就这两个啊）5. 手撕MHA（pytorch）；GQA的原理。6. 输入的padding部分是如何参与计算的；为什么用left padding而不是right padding。7. 让大模型确保输出json格式有什么办法？8. 介绍一下softmax的数值溢出，以及有什么办法解决。反问：主要业务是什么；实习时间的要求。感觉比之前面试状态要好很多，回答还是比较流畅。同时，这次发现了一些之前没复习到的地方，回去一定补。

菜菜子不想再菜了：破案了，原来是critic model

查看9道真题和解析

点赞评论收藏

分享

03-16 11:49

北京科技大学算法工程师

美团算法一面

📍面试公司：美团👜面试岗位：大模型春招📖面试问题：问了 PPO 重要性采样系数怎么才能为1？调节批量，学习率，超参数啥的 不懂，策略收敛最优解不就为一了吗grpo 的 GAE 怎么算，和批量大小有没有关系？为啥没有要PPO的v函数？离轨策略和在线策略的关系？ 冷启动 + grpo 怎么做的？仿真寻优（实习项目）的 PPO 和 openai 的PPO有啥不同？ 项目的p(s'|s,a)=1,状态转移矩阵非常稀疏手撕链表 切断+翻转+链表合并Input: 1->2->3->4->5->6->7Output: 1->7->2->6-&gt...

查看9道真题和解析

点赞评论收藏

分享

评论

13

33

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 腾讯音乐求职进展汇总 #

56866次浏览 342人参与

# 互联网公司评价 #

347855次浏览 3608人参与

# 牛友故事会 #

311680次浏览 8558人参与

# 你的秋招第一面感觉怎么样 #

60811次浏览 485人参与

# 怎么防止在试用期被辞退 #

110167次浏览 848人参与

# 百度工作体验 #

188252次浏览 1843人参与

# 秋招投简历越早越好吗 #

61008次浏览 605人参与

# 盲审过后你想做什么？ #

9674次浏览 93人参与

# 国企vs私企，怎么选？ #

18120次浏览 157人参与

# 面试等了一周没回复，还有戏吗 #

101059次浏览 936人参与

# 我在牛爱网找对象 #

161076次浏览 1222人参与

# 聊聊这家公司值得去吗 #

195385次浏览 2061人参与

# 职业发展规划如何回答 #

29605次浏览 166人参与

# 互联网回暖，腾讯要招5000+人！ #

258785次浏览 4872人参与

# 实习要如何选择和准备？ #

19369次浏览 348人参与

# 没有实习经历还能找到好工作吗？ #

6792次浏览 38人参与

# 你认为工作的意义是什么 #

119881次浏览 907人参与

# 你的工资什么时候发？ #

20775次浏览 164人参与

# 你的办公桌上都有什么？ #

3604次浏览 27人参与

# 风评不好的公司，你会去吗？ #

29552次浏览 136人参与

牛客网
牛客企业服务