找不到实习的大摆子

08-07 16:21 北京大学自然语言处理发布于江西

关注

快 STAR 大模型应用面经

一开始会以为问的很难，然后还是集中在项目，八股也比较常见，虽然问的还挺深，我没答出来很多。
1. 先写题，dp，两个字符串最长子序列
2.自我介绍
3. 挖项目挖了很久
4.peft 微调介绍一下
5. 常见的位置编码介绍一下
6.transformer 的 decoder 和 llama 有啥区别
7. 他们的位置编码有啥区别？三角函数位置编码和 ROPE 公式很像啊，他们是怎么实现不同的功能？（一个加 embedding 一个加 KQV，但是公式很像但是推理完全不一样吧，不太会答）
8. ADAM 比 SGD 优化在哪里（不会，没背这块）介绍一下梯度下降
9. 回归任务常用的 LOSS（我还搞成了自回归，然后说现在大模型都是用交叉熵。。。后面反应过来说离散分类任务交叉熵，连续值用 MSE）然后问我二分类用什么，我说 BCE。
10. 用 ADAM 的话，怎么预估 SFT 的显存占用？（这个问题好高频啊，感觉现在很喜欢问这种预估显存占用的问题。。。，我也没怎么回答，不太会）
时间太久了，就随便反问了一下。

全部评论

推荐最新楼层

Gold知难而进

深圳大学算法工程师

当作面试一样回答一下这些问题： 1. 子序列两层for循环，if s[i] == s[j]: dp[i][j] = dp[i - 1][j - 1] + 1 else : dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]) 2. xx 3.xx 4. lora, p tuning v1 v2, adapter tuning, prefix tuning. 5. 绝对，相对位置编码， Rope旋转位置编码 6. 从输入开始，一个是绝对位置编码一个是Rope编码。经过embedding层后，transformer decoder直接输入注意力层，而llama则是先经过norm，一个是Post norm一个是Pre norm,同时norm这里的区别前者为layer norm后者为Root mean square norm，对于注意力层，llama是GQA而transformer decoder是MHA，再经过FFN层，FFN层的激活函数transformer deocder是Relu,而llama没记错的话是SwiGelu，（就想到这些，不知道还有没有不同） 7. 不知怎么答 8. SGD ， w = w - lr * gradient， Adam引入了一阶动量与二阶动量（方差） 9. 交叉熵损失 10. 假设dB参数的大模型，模型与梯度半精度fp16保存，一个参数两个字节，则占用2d G + 2d G = 4d G显存，优化器如果用adam，fp32保存模型权重备份，动量与方差，则占用3 * 4 * d G = 12d G显存，对一个dB参数的大模型做full training显存占用估计在16dG。(deepspedd, 模型并行，张量并行之类的可能会继续问了）欢迎补充点评

3 回复分享

发布于 08-14 14:32 广东

找不到实习的大摆子

楼主

北京大学自然语言处理

还问了 attention 公式，为什么要除以根号 dk，为什么会发生梯度消失或者梯度爆炸？（就是经常被问但是答不好）

2 回复分享

发布于 08-08 01:56 江西

游卡校园招聘部HR_主页内推

游卡_人力资源管理_HR(准入职员工)

大佬真厉害

2 回复分享

发布于 08-10 09:00 江苏

康冠科技金牌内推官

康冠科技KTC_人力资源管理_HR(准入职员工)

这个确实强

2 回复分享

发布于 08-10 10:32 江苏

门头沟学院算法工程师

周五也要面快star了

1 回复分享

发布于 08-07 21:43 北京

晴天雨天下雨天

中国科技大学前端工程师

参加的都是大神云集

1 回复分享

发布于 08-10 16:13 江苏

北京航空航天大学算法工程师

Adam结合了动量和RMSProp，可以对参数进行自适应的学习率调整，训练初期收敛更快。SGD需要手动调整学习率，在最小值平坦区域收敛变慢（摘抄自CSDN）

1 回复分享

发布于 08-19 16:24 北京

马鞍山学院算法工程师

是线上IDE还是本地呢，题目的话是会给图片还是念呢

点赞回复分享

发布于 08-08 10:30 北京

找不到实习的大摆子

楼主

北京大学自然语言处理

八股还是要好好准备，一知半解不太行，被挂了。

点赞回复分享

发布于 08-08 15:27 河南

门头沟学院算法工程师

佬很厉害了，能求个快star进面的bg么

点赞回复分享

发布于 08-09 09:25 浙江

11-20 17:16

淘天集团_HR

淘天11月算法内推

很多同学已经被逼签了，局势其实已经开始变化了，各个厂子都有被鸽的岗位，很多hr开始线下捞人，比如咱们的算法部门有有有开始捞人了 岗位算法技术未来生活实验室：算法工程师-机器学习、算法工程师-自然语言处理、算法工程师-多模态部门淘天集团算法技术未来生活实验室建议：熟悉LLM或MLLM的训练等技术，或者有相关领域的研究;在ICCV、CVPR等国际顶级会议、期刊上发表论文，或在相关学术会议组织的权威比赛中获奖或在校园内或互联网公司有相关实习或项目经历更佳;以及熟悉算法和infra的多面手们可以用我的内推链接（点击就是直接内推了）：https://talent.taotian.com/ca...

投递淘天集团等公司10个岗位 >

点赞评论收藏

分享

11-02 11:46

浙江师范大学 Java

数字马力二面面经

面试时长：  大概65min0.项目拷打、论文方向、研究细节、介绍公司业务1.场景题：多线程停车场管理2.软件开发模型  （没绷着  只记得三个）3.详细说下增量模型  （瞎扯大概扯了八九成）4.Mysql索引用B+树的原因5.JVM内存模型  如何进行OOM分析6.类加载过程（问我是不是猜的  但是这个确实是八股背过的啊）7.怎么导出堆内存文件8.RocketMQ三个部分的关系9.怎么保证RocketMQ副本间的一致性  （应该是消息队列集群的东西  不会）10.InputStream和BufferedInputStream的区别 10.一些具体工作场景的解决方案  （遇到自己解决不了的问题该怎么办、同事间冲突管理）11.一面二面那个强度大  （这个似乎第一次碰到问这个的）反问：后续流程  （通过的话两三周内联系offer）哪里需要改进  （不会的就坦诚些  可能是增量模型那里胡扯的太多了）感觉强度确实比一面大 基本是对着简历在问  不知道能不能给一个机会

查看13道真题和解析

点赞评论收藏

分享

11-09 14:39

淘天集团_HR

淘天补录——算法类

是真没想到算法还要补人，之前T计划已经招了一批，加上陆续发放的offer，可能前面毁约的人还是有一部分，牛客随缘再捞点大佬，各位还没签约或者签了的捞们看看这里，流程处理绝对快（别让我求你投了）岗位算法技术未来生活实验室：算法工程师-机器学习、算法工程师-自然语言处理、算法工程师-多模态部门淘天集团算法技术未来生活实验室建议：熟悉LLM或MLLM的训练等技术，或者有相关领域的研究;在ICCV、CVPR等国际顶级会议、期刊上发表论文，或在相关学术会议组织的权威比赛中获奖或在校园内或互联网公司有相关实习或项目经历更佳;以及熟悉算法和infra的多面手们可以用我的内推链接（点击就是直接内推了）...

投递淘天集团等公司10个岗位 >

点赞评论收藏

分享

11-05 17:25

北京邮电大学算法工程师

快手多模态AIGC被拷打

第一个大厂面就这么走远了，心有不甘，但是确实不匹配，只能说还得学，还有机会。

点赞评论收藏

分享

10-30 12:56

去哪儿_测试开发(准入职员工)

吉利云端测开面经：一面+二面

一面 10.23  35min1. 前一段工作是做什么的，大模型是什么类型，是怎么测的2. 代码走查是怎么做的，最近一段实习做哪些内容3. 接口自动化怎么测的，UI自动化呢，pytest项目结构4. 了解python吗，python有哪些数据类型，元祖和list有什么区别5. python怎么读取一个文件的9-10输出到另一个文件，说说思路6. python迭代器和生成器的区别（不会）7. 了解Linux吗，用过哪些指令8. 你对测试职业的看法，你个人觉得有什么优势9. 反问工作内容，面评二面 10.30 30min有两个面试官1. 第一个面试官：看你经历做过大模型测试？是怎么测的，有哪些标准？2. 检测指标是怎么界定的，写过多少测试用例3. 你第二段实习是做什么的，有哪些工作4. 第二个面试官：第一段实习为什么离职，第二段实习有转正吗5. 你测大模型哪些业务功能，用的什么预训练模型，测检索有用到RAG吗6. 你做过的算法项目里用的什么模型，用的哪些指标，精确率和召回率怎么样7. 你说提升了精确率，但召回率下降导致漏检怎么办8. 反问岗位我就是面个测试而已......

查看17道真题和解析

点赞评论收藏

分享

评论

23

68

全站热榜

正在热议

# 25届秋招总结 #

377368次浏览 3743人参与

# 如果再来一次，你还会选择这个工作吗？ #

101361次浏览 1022人参与

# 阿里云管培生offer #

46249次浏览 1377人参与

# 地方国企笔面经互助 #

6028次浏览 14人参与

# 简历被挂麻了，求建议 #

2525261次浏览 33458人参与

# 发工资后，你做的第一件事是什么 #

4694次浏览 19人参与

# 北方华创开奖 #

64590次浏览 503人参与

# ai智能作图 #

11252次浏览 181人参与

# 我的实习求职记录 #

6105906次浏览 83837人参与

# 如果你有一天可以担任公司的CEO，你会做哪三件事？ #

8830次浏览 180人参与

# 上班到公司第一件事做什么？ #

14585次浏览 164人参与

# 阿里求职进展汇总 #

71828次浏览 780人参与

# 如何写一份好简历 #

615934次浏览 8700人参与

# 听到哪句话就代表面试稳了or挂了？ #

96753次浏览 810人参与

# 还记得你第一次面试吗？ #

29651次浏览 416人参与

# 华为工作体验 #

109396次浏览 852人参与

# 面试体验感最好的是哪家？ #

91576次浏览 921人参与

# 网易求职进展汇总 #

38916次浏览 334人参与

# 如果有时光机，你最想去到哪个年纪？ #

27077次浏览 559人参与

# 腾讯求职进展汇总 #

205720次浏览 1687人参与

# 硬件兄弟们甩出你的华为奖状 #

75831次浏览 615人参与

# 上班苦还是上学苦呢？ #

106773次浏览 865人参与

牛客网
牛客企业服务