04-22 22:21 门头沟学院自然语言处理发布于上海

关注

大模型暑期实习面经｜腾讯音乐娱乐集团技术研究—自然语言处理

部门：QQ音乐
base地：深圳
流程：一面+二面+三面+HR面
推进速度：非常快，每一面在一小时内出结果

一面 50min

自我介绍
论文介绍
什么是MHA
Attention运算公式
为什么除以根号dk
介绍现有相对位置编码和绝对位置编码的异同点，都有哪些结构
RoPE的结构
RoPE相比于绝对位置编码的优势是什么？为什么外推性更好？
为什么RoPE理论上可以无限外推？
RoPE为什么可以利用绝对位置和相对位置的优势？
介绍RAG项目（基座模型是什么？几b ？全参微调用了多少卡？数据多大？问答对的形式有图片吗？
对RAG的理解是什么？为什么要用RAG？
BGE模型的结构
什么是LoRA？有个两层神经网络，参数1万*一万，低秩r =100， LoRA参数量是多少？
为什么用KV Cache？
KV Cache有哪些优化方法？
文生图/图生文结构了解吗？文生图的怎么解码的
CLIP了解吗？
Deepseek MOE架构路由机制的细节
场景题
手撕：快速排序
反问

二面 60min

自我介绍
论文拷打，提出质疑
RAG项目介绍
分块的策略是什么
PDF的表格和图片怎么解析的？图片和表格的信息丢失了怎么办？
RAG的关键词检索和重排细节
异构图方式和传统的多模态拼接方式有什么性能上的改进吗？
多模态之间的特征的对齐你是怎么做的？现有工作怎么做的
Prompt有什么系统性优化的方法？
代码：199: 二叉树右视图
简单介绍一下Prefix Cache ? Deepseek 是怎么开启Prefix Cache的？
位置编码的作用的实现方式有哪些？
LLM推理部署的时候，会用vLLM, 这主要从哪些方面提升？怎么提升的推理速度？
文本生成解码策略，贪心搜索和束搜索的优劣是什么？
实习时间，反问

三面 50min

自我介绍
论文拷打，细到实验结果数据
RAG项目400万文字怎么分块，索引，embedding的
微调的指标和RAG的指标是什么？ROUGE指标怎么计算
评估方式是不是太简单了，对SFT的指标还有没有更好的
项目中负责的部分
用的最多的GPU时间是多少
有做过多机多卡训练吗
为什么去前端实习了后又转算法
对未来的规划是什么，想做什么技术
实验室的方向是什么
大模型的预训练和SFT的不同是什么
限制大模型输入长度的因素有哪些？
目前的大模型如何解决长上下文？

HR面 30min

主要问项目、规划等，氛围比较轻松

#大模型算法工程师##NLP##大模型##腾讯音乐26届实习#

全部评论

推荐最新楼层

牛客651524327号

算法工程师

确实厉害，膜拜一下大佬。（许愿三面过）

1 回复分享

发布于 04-23 00:24 陕西

kewuenkun

四川大学 C++

大佬投了多久约面的

点赞回复分享

发布于 04-26 23:20 四川

理塘有嘻哈

重庆邮电大学算法工程师

八股这么难么

点赞回复分享

发布于 04-26 07:01 四川

04-23 16:27

已编辑

门头沟学院算法工程师

大模型暑期实习 offer选择

鼠鼠之前是搞垂域llm训练的，offer也偏应用，想找个对秋招帮助大的，但不知道怎么选，请各位佬帮忙看下~1、阿里-飞猪-大语言模型和智能客服业务场景是做大模型的智能客服，优点是阿里系的转正率高，飞猪也不卷，缺点是飞猪有点边缘了2、美团-keeta-算法策略是美团的出海品牌，处于扩展期，部门应该算核心之一？鼠鼠投的大模型算法，面试的时候也聊大模型，不过最后发的岗位是算法策略，面试官说主要做商品、商家方向，比如竞对、大模型打商品标签、商家助手之类的，还有用户增长，广告素材的生成等场景，鼠鼠只会llm，这些听不懂啊，有没有佬说下这种方向的前景？3、腾讯-csig-腾讯地图-大模...

投递美团等公司10个岗位 >

点赞评论收藏

04-19 06:34

Columbia University 算法工程师

腾讯大模型（技术研究-自然语言处理）面经

补发一下之前面试腾讯的面经，具体timeline可以参考前面的帖子。一面（约30mins）：自我介绍，挑一个简历里最好的一个项目详细介绍下项目中遇到了什么挑战，怎么解决的了解DeepSeek吗，为什么DeepSeek现在这么火？说一下DeepSeek里的MLA和GRPOGRPO和DPO，PPO，RLHF的区别看你之前有LoRA微调DeepSeek的项目，简单说说微调经验，效果如何RAG在检索阶段能有哪些优化？（sub-query，HyDE等）二面（约1h10mins）：自我介绍，拷打简历。写一下GRPO的公式先屏幕共享从头到尾walk through讲一下DeepSeek技术报告论文。面试官中间会穿插提问DeepSeek-v3/r1/r1-zero有什么区别DeepSeek-r1-zero的冷启动数据是怎么组成的DeepSeek-r1-zero解决了DeepSeek-r1的哪些问题如何解决大模型的幻觉Embedding如何微调（讲了对比学习啥的）RAG的评测指标有哪些业界现在function call的做法和水平场景题：大致是RAG中检索结果遇到张冠李戴的问题该如何解决举几个例子能够体现你的研究能力三面（约30mins）拷打LoRA微调项目，问了实验的数据集，参数设置，结果如何等等你目前的研究方向主要是什么？讲一下ReRanker的目的，做法有哪些场景题：我现在运用RAG来检索回答，目标是检索四个季度的表格数据，但是经过检索+ReRanker后只出现了三个季度的数据，该如何解决hr面（约15mins）比较常规，大致如下：用三个词语描述下你为何能胜任这份工作你的优缺点都说一下你过往实习项目中遇到过的最大困难是什么，怎么解决的最早实习时间，实习时常引流：腾讯字节阿里淘天美团拼多多#暑期实习##腾讯##大模型#

Rafae1：接好运

查看27道真题和解析

点赞评论收藏

04-22 10:41

已编辑

门头沟学院自然语言处理

大模型 0实习经验暑期实习投递记录

个人背景：双9，0对口实习+0对口论文，2月中下旬投完小论文后，由于自己本身没有太多大模型的经验，一直在纠结是做传统NLP/搜广推/大模型，甚至是开发。在纠结思考了很久，综合牛客+xhs各路dl的建议后，决定全力梭哈大模型。准备过程2月中下旬开始准备大模型八股+刷力扣，目前力扣300题左右，八股找了一些大模型资料看了一遍之后，3月中下旬开始大规模海投。投递记录OPPO：大模型算法岗，3.7投递，一直在初筛阶段；蔚来：大模型应用研究岗， 3.9投递，一面 + 二面后OC已拒；腾讯音乐：技术研究—自然语言处理（TME没有专门的大模型岗），3月初投递，一面 + 二面 + 三面 + HR面， OC；美...

职导未来：在薪资待遇相同的情况下选offer策略，公司知名度＞项目含金量＞项目承担角色

投递蚂蚁集团等公司10个岗位 >

点赞评论收藏

04-18 08:06

中山大学算法工程师

大厂面经｜字节大模型算法岗

✅一面1️⃣深挖多模态论文2️⃣介绍transformer架构3️⃣详细说一下Decoder的因果注意力 QKV分别来自哪4️⃣Attention为什么要做scaled 不做会怎么样 为什么用根号d_k5️⃣Transformer怎么做加速训练（KV缓存） 训练和推理有什么区别（并行化）6️⃣深挖多模态大模型论文用的video-llama 讲一下大模型的结构7️⃣论文用了CoT讲一下论文的CoT是怎么样的8️⃣微调用的LoRA介绍一下LoRA9️⃣LoRA初始化怎么做的，用的秩是多少，为什么不选其他的数1️⃣0️⃣知道deepspeed和megatron吗？分别介绍一下1️⃣1️⃣论文用的deepspeed详细讲了一下三个stage分别是什么✅二面1️⃣深挖多模态和大模型的论文2️⃣Decoder文本生成有哪几种方法3️⃣还知道哪些多模态大模型4️⃣介绍一下ALBEF、BLIP5️⃣BLIP2的结构是什么  两阶段怎么训练的 有哪些损失6️⃣知道PEFT吗 讲一下LoRA7️⃣还有什么微调方法 -&amp;gt; prefix-tuning和P-tuning 两者分别是怎么做的 为了解决什么提出的8️⃣后面就是一些场景题✅三面1️⃣深挖论文2️⃣讲一下multi-head attention 用pytorch手撕一下 要可以实现cross attention的3️⃣讲一下你用的大模型是什么结构 特征是怎么喂给大模型的4️⃣大模型训练为什么不用SFT5️⃣LoRA是什么？有什么好处6️⃣知道RLHF吗？讲一下训练流程7️⃣接下来就是好几个场景题，电商相关的，用大模型解决prompt应该怎么设计，怎么处理prompt的输出，怎么过滤错误格式的输出📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

字节跳动三面455人在聊

查看23道真题和解析

点赞评论收藏

04-22 10:43

腾讯音乐娱乐集团_软件开发-业务运维方向(准入职员工)

腾讯音乐内推-腾讯音乐内推码

腾讯 软件开发 面经9月06日  网申9月07日  测评9月13日  一面自我介绍项目介绍零拷贝DMA缓存分配回收策略分级缓存池 扩容机制 分级策略RBACJWT加密算法es 倒排索引实现一个分词器分词算法结果集排序规则怎么判断结果和用户的相关性怎么计算相关性 频率、密度、权重限流和熔断如何实现一个限流机制场景题 QQ音乐推荐策略怎么计算用户的音乐偏好怎么计算用户和音乐的匹配度怎么设计推荐算法怎么过滤掉用户已经听过/推荐过的音乐 怎么压缩听歌记录说一下布隆过滤器怎么解决哈希冲突k8snetstat、jstat命令Docker资源隔离原理HTTPS握手过程C++虚函数手撕（easy）反问全程70...

点赞评论收藏

招聘动态

26届实习求职交流群

26届实习软件笔试必刷题单

字节跳动Tik Tok

26届实习招聘

26届投递链接合集

滴滴

2026届秋招储备实习生招聘

快手

25届补录+26届实习

字节跳动

25届补录&26届实习

硅谷数模半导体

25届校招进行中

字节跳动-Tik Tok

26届实习生招聘

25届春招专场

全站热榜

创作者周榜

正在热议

# 运营人的第一份offer应该如何选 #

137118次浏览 1069人参与

# 如果能重来，就业or读研你选哪个？ #

大模型暑期实习面经｜腾讯音乐娱乐集团 技术研究—自然语言处理

一面 50min

二面 60min

三面 50min

HR面 30min

全站热榜

创作者周榜

大模型暑期实习面经｜腾讯音乐娱乐集团技术研究—自然语言处理