04-02 19:08 浙江大学算法工程师发布于上海

关注

字节大模型二面面经（持续记录！！

面试的部门是字节seedlm
二面感觉面试官很和善

面试问题：
- transformer 的 decoder 和 llama 有啥区别，他们的位置编码有啥区别？三角函数位置编码和 ROPE 公式很像啊，他们是怎么实现不同的功能？（一个加 embedding 一个加 KQV，但是公式很像但是推理完全不一样吧，不太会答）
- 介绍一下RLHF流程，包括哪几步
- llm有哪些评估指标？如何评估模型？
- lora原理细节，为什么可以加速？什么是秩？
- reward bench上的reward model分哪几类？reward model如何训练的，训练目标是什么？
- dpo训练的损失函数和训练目标，dpo如何改进
代码题：
- 给定长度为 n+1 的数组 nums，其中元素取值范围为 [1, n]，求唯一的重复数。
- 手写多头注意力mha，写完后让加位置编码（因为之前写过了，继续吟唱）

全部评论

推荐最新楼层

楼主

浙江大学算法工程师

需要面经的戳我😋

点赞回复分享

发布于 04-08 12:26 上海

甘之如饴啊

天津职业技术师范大学售前技术工程师

大佬可以分享下面经的那些东西吗？本人一直在做大模型sa想跳，但还是想看下整理好的面经

点赞回复分享

发布于 04-07 14:31 广东

03-21 07:01

南京大学算法工程师

大模型面经 - 字节

字节跳动三面428人在聊面试经验分享

点赞评论收藏

分享

04-08 16:15

浙江大学算法工程师

字节大模型面到三面了！撑住！

继续贴一下整理好的面试记录😬面试问题：- MLA是怎么做的？为什么它比LoRA快？同样是低秩分解，为啥推理时LoRA慢而MLA快？- LoRA算法是怎么工作的？它的参数是怎么初始化的？你觉得它有什么缺点？- 能介绍一下Flash Attention吗？它是怎么做到既省显存又提速的？- 能聊聊你在阿里做的工作吗？RM的MoE结构为什么这么设计？参数量大概是多少？- 提升模型的推理能力和指令跟随能力，哪个更难？为什么？优化指令跟随能力的方法和优化推理能力的方法有什么不同？- RLHF的幻觉实验具体是怎么做的？能详细说说实验步骤吗？代码题：- 用np手撕beam search，我大概写了下实现，比如怎么办理beam中的序列，怎么计算新序列得分，这个确实抽象了（既然遇见了，有时间还是准备一下吧）还有需要注意的是，在面试的时候，进入飞书会议后，不要切换后台！不要切换网页！不要切换窗口！只要切换了，就会被检测到（字节面试官亲自提示过😭

查看6道真题和解析

点赞评论收藏

分享

昨天 21:54

已编辑

北京理工大学算法工程师

蚂蚁-支付宝-大模型应用二面已过二面

自我介绍项目。用文本进行图像搜索项目，用户的输入文本和训练使用的有偏差怎么办（例如比较口语化）？从现场弄一些数据进行微调，或者给用户一下提示，让用户知道怎么样能更好的匹配。无做题。反问：岗位相关。为什么支付宝现在支付会减几块钱？以及碰一碰。因为wx一般大家都是打开的，买东西的时候，不用切换app进行支付。简单的优势就导致支付宝落在了下风，因此用优惠和碰一碰来和wx竞争。40 min结束。一分钟后面试通过。蚂蚁的面试流程真是舒服啊！

查看7道真题和解析

点赞评论收藏

分享

04-02 19:06

浙江大学算法工程师

字节大模型一面面经（强度真高！！

面试问题：- 聊聊对transformer的理解，整体结构是怎样的？几个部分组成- Attention的公式里为什么要除以根号dk？这个操作有什么作用？另外，为什么在训练过程中容易出现梯度消失或梯度爆炸的问题？- （针对简历提问）在sft中遇到了哪些问题？最后是怎么解决的？能不能分享一下你的经验？（好好好套方案？）- （针对简历提问）领域大模型数据配比是如何考虑的？不同领域的数据比例如何确定？- 为什么现在的LLM都是Decoder-only？这种结构有什么优势？- ADAM优化器比SGD好在哪？简单介绍一下梯度下降的原理，ADAM是怎么改进的？。。。代码题：- 给定一个互不相同的整数数组 nums，求其所有子集（幂集）。（类似leetcode78）- （第二个题好像是个字符串的题，忘了）

查看6道真题和解析

点赞评论收藏

分享

昨天 21:56

已编辑

北京理工大学算法工程师

蚂蚁-支付宝-大模型应用一面(已过)

先自我介绍。项目。感觉面试官不太懂多模态。也没问啥。无八股。做题。代码：三数之和。钉钉出现故障，面试官口述了问题，然后让我讲了一下思路。反问。面试官说了很多。挺能聊的。岗位主要是做 agent 相关，用户出行规划、订票(机票火车票)建议。工作内容还可以，不是那么无聊。感觉不太匹配，50%概率挂。

查看4道真题和解析

点赞评论收藏

分享

评论

2

23

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 春招进度记录 #

56000次浏览 419人参与

# 毕业后不工作的日子里我在做什么 #

155309次浏览 1349人参与

# Keep实习校招 #

23495次浏览 146人参与

# 实习进度记录 #

58569次浏览 482人参与

# 你的实习什么时候入职 #

160012次浏览 1393人参与

# 风评不好的公司，你会去吗？ #

31690次浏览 146人参与

# 你知道哪些职场黑话？ #

26430次浏览 199人参与

# 总结:哪家公司最喜欢泡池子 #

120020次浏览 439人参与

# 你想吐槽公司的哪些规定 #

12554次浏览 43人参与

# 你的工资什么时候发？ #

23012次浏览 186人参与

# 软开人，说说你的烦心事 #

37603次浏览 243人参与

# 生化医药面经大本营 #

95259次浏览 462人参与

# 淘天集团工作体验 #

5670次浏览 28人参与

# 汇川技术求职进展汇总 #

115904次浏览 792人参与

# 拼多多工作体验 #

15171次浏览 145人参与

# 打工人的工作餐日常 #

32336次浏览 287人参与

# 小鹏汽车工作体验 #

6894次浏览 44人参与

# 诺瓦星云求职进展汇总 #

189480次浏览 1629人参与

# 金融银行面经 #

66444次浏览 506人参与

# 一觉醒来，秋招难度下降一万倍…… #

62215次浏览 543人参与

# 同程求职进展汇总 #

10764次浏览 88人参与

牛客网
牛客企业服务