找不到实习的大摆子

2024-03-12 13:04 北京大学自然语言处理

关注

百川智能大模型实习一面

被拷打了一个半小时，感觉也寄了。
1.自我介绍
2. 针对字节的实习，问我 flask 和 go 的 gin 框架的体验和区别（我黑人问号，以为走错了，不记得了，随便说了几句。
3.你熟悉 C++，说一下堆和栈的区别
4.数据结构中堆栈队列介绍一下。
5. 拷打第二份实习大模型的具体内容，主要还是我介绍。

6. 你知道预训练的一些并行方式吗？
（说没接触过预训练，大概讲了一下知道的两种常用并行，就是数据并行和模型并行解释了一下）
7.你知道预训练的数据应该怎么预处理吗？
（没懂，我说针对质量进行过滤吧？
8.换句话说，如果我不需要对所有的数据都训练，只需要对每一部分有权重的取数据怎么做？
（我：最暴力的方法就是每一块都按比重选一定数量再用于训练）
你这个是离线方式，我在线想要调试各种方式怎么做？（我：随机数然后映射到对应的数据去随机取？）
9.你知道 Llama 用了多少 token 数据训练吗？（我这真没记）
10. 你知道 flask attention 吗？（没用过，不知道原理，只知道这个东西存在。。
11.那你知道 flask attention 能有多大的性能提升吗？不知道
12. 你知道最早的 attention 做机器翻译，它的注意力怎么得的吗？（不记得，瞎说一通）
13. 这个 attention 和 self attention 的 QKV 怎么来的？（attention 应该是初始化的吧？巴拉巴拉瞎说
14. 有了解过最近那些超长文本大模型的预训练吗？（没有了解具体原理，但是应该就是加大数据训练长度，用外推更好的位置嵌入吧？）
15. 你说到外推性，那你了解常见的提高外推能力的方式吗？（主要还是位置编码吧？给他讲解了一下 ALIBI 这个方式）
16 讲一下你对旋转位置编码的理解。
17 位置和注意力分数的曲线是什么样子的呢？（一条向上的抛物线，位置越远注意力越小）
18. 这个曲线会不会和三角函数一样呢？（我觉得如果是用 Transformer 原本的位置嵌入可能会吧。。。。其他的应该不会？）
19 回到我们刚刚说的数据处理，你能不能用代码实现一下看看？（自己电脑没装 Python pytorch，就用 Cpp 写，简单写了个逻辑，随机数有点问题，也跑不通，大概说了一下方式）
在写个反转链表
反问：

全部评论

推荐最新楼层

门头沟学院 Java

老哥现在开发和大模型岗位投递意向是五五开吗？

2 回复分享

发布于 2024-03-12 14:20 北京

找不到实习的大摆子

楼主

北京大学自然语言处理

反问了具体做什么内容，偏工程还是科研。自己表现如何。

点赞回复分享

发布于 2024-03-12 13:04 北京

Java皆是牛马

Imperial College London Java

已经开始等待CEO面了

点赞回复分享

发布于 2024-03-12 16:05 北京

找工作好难玉玉了😇

江苏大学 Python

Mark，明早面😡

点赞回复分享

发布于 2024-03-14 14:19 北京

牛客150955439号

北京大学自然语言处理

我也面了...但听着好像就是让我主要去处理数据（我很菜无论文无实习

点赞回复分享

发布于 2024-03-14 17:16 北京

门头沟学院算法工程师

实习整这么难

点赞回复分享

发布于 2024-03-18 16:15 广东

捞月亮的渔民y

门头沟学院算法工程师

大佬投了多久收到电话的

点赞回复分享

发布于 2024-03-19 21:18 广东

牛客732088295号

Nanyang Technological University 算法工程师

佬，面试官应该问的是flash attention吧

点赞回复分享

发布于 2024-04-25 14:46 上海

02-26 17:48

小米_小爱算法策略组_算法工程师(实习员工)

字节大模型算法实习生-电商业务（已oc）

字节很喜欢深挖简历，通常不会直接问八卦，而是结合项目问，所以项目一定要吃透，用到的技术要理解的很深入，此外会有面试官结合他们的业务问一些场景问题，问如果是你你会怎么做等等。一，二，三面都是这个模式，我把一些他们根据简历问的通用问题记录一下，供大家参考。1.使用SFT进行微调时的训练数据是如何构造的，如果缺少训练数据有没有什么方法？2.看你使用的是千问大模型，请问千问的模型结构，创新点是什么？3.看到你在SFT的基础上使用了dpo来训练，为什么要使用dpo，sft不行吗？4.sft解决不好的badcase，为啥dpo就能解决了？你认为sft适合解决那类问题？dpo又适合解决哪类问题？5.dpo的...

查看13道真题和解析

点赞评论收藏

分享

不愿透露姓名的神秘牛友

03-03 17:07

网易大模型实习生

📍面试公司：网易有道👜面试岗位：大模型 实习生📖面试问题：1. top-k和top-p2. 对比损失和llm中的temperature3. lora微调4. llm中的强化学习5. 训练样本的文本如何构建的，输出的格式6. rag🙌面试体验：问的很细，难，一轮直接挂 #大模型面经#

查看6道真题和解析

点赞评论收藏

分享

03-12 18:14

小米集团_nlp算法工程师(实习员工)

蔚来大模型实习生

1、自我介绍2、聊项目3、聊了一下论文4、算法题：最长山峰前几天面的，今天发感谢信了。感觉聊的还行，算法题也写出来了，想不通。

查看4道真题和解析

点赞评论收藏

分享

03-12 17:56

已编辑

门头沟学院算法工程师

求拷打双9无论文一段大厂实习能冲暑期吗

双9 末流985目前研二 无论文一段美团日常实习（多模态大模型相关）想问问暑期实习能冲大厂的大模型算法岗吗？没论文是不是硬伤啊😫#大模型# #暑期实习   # #算法岗#

点赞评论收藏

分享

03-12 11:28

小米_算法实习生(实习员工)

3.10 小米算法实习生（大模型）二面（50min）

3.10 小米算法实习生（大模型）二面（50min）无脸男*2自我介绍项目的目的混合精度微调，是混合什么精度Qlora如何实现冻结矩阵的反量化如何实现（面试官提示后答出来）如果要用FP16精度转换到int4，如何使误差最小，实现过程？介绍GRPO、PPO、DPO之间的区别既然GRPO的会有方差问题，那GRPO应用到什么样的背景下，SFT要做怎样的处理，才能够使GRPO强化学习微调效果更好GRPO的Group可以如何选取手撕：MHA反问：实习生在部门中负责的任务，做一些方案的实验研究，了解业务；计算资源，充足

查看10道真题和解析

点赞评论收藏

分享

评论

17

46

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习要如何选择和准备？ #

8153次浏览 225人参与

# 正在实习的你，几点下班 #

98129次浏览 706人参与

# 携程求职进展汇总 #

202360次浏览 1701人参与

# 美团求职进展汇总 #

1619303次浏览 14601人参与

# 面试等了一周没回复，还有戏吗 #

97525次浏览 891人参与

# 字节求职进展汇总 #

706421次浏览 7169人参与

# 面试被问第一学历差时该怎么回答 #

103822次浏览 657人参与

# 中广核工作体验 #

10736次浏览 50人参与

# 蚂蚁集团工作体验 #

9228次浏览 67人参与

# 科大讯飞工作体验 #

15562次浏览 46人参与

# 满分简历要如何准备？ #

14239次浏览 273人参与

# 稳定和高薪机械人更看重哪个？ #

421630次浏览 5293人参与

# 金蝶求职进展汇总 #

39661次浏览 227人参与

# 牛友打假中心 #

36553次浏览 2309人参与

# 我想去国央企的原因 #

52981次浏览 319人参与

# 讲讲我的真实离职原因 #

32882次浏览 621人参与

# 通信硬件2023笔面经 #

30379次浏览 234人参与

# 听到哪句话就代表面试稳了or挂了？ #

120668次浏览 1092人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

87007次浏览 626人参与

# 用表情包形容我的2023 #

6728次浏览 46人参与

# 工作两年想退休了 #

98231次浏览 1030人参与

牛客网
牛客企业服务