百川智能大模型实习一面

被拷打了一个半小时, 感觉也寄了。
1.自我介绍
2. 针对字节的实习,问我 flask 和 go 的 gin 框架的体验和区别(我黑人问号,以为走错了,不记得了,随便说了几句。
3.你熟悉 C++,说一下堆和栈的区别
4.数据结构中堆栈队列介绍一下。
5. 拷打第二份实习大模型的具体内容, 主要还是我介绍。

6. 你知道预训练的一些并行方式吗?
(说没接触过预训练, 大概讲了一下知道的两种常用并行,就是数据并行和模型并行解释了一下)
7.你知道预训练的数据应该怎么预处理吗?
(没懂,我说针对质量进行过滤吧?
8.换句话说, 如果我不需要对所有的数据都训练,只需要对每一部分有权重的取数据怎么做?
(我:最暴力的方法就是每一块都按比重选一定数量再用于训练)
你这个是离线方式,我在线想要调试各种方式怎么做?(我:随机数然后映射到对应的数据去随机取?)
9.你知道 Llama 用了多少 token 数据训练吗?(我 这真没记)
10. 你知道 flask attention 吗?(没用过,不知道原理,只知道这个东西存在。。
11.那你知道 flask attention 能有多大的性能提升吗? 不知道
12. 你知道最早的 attention 做机器翻译,它的注意力怎么得的吗?(不记得,瞎说一通)
13. 这个 attention 和 self attention 的 QKV 怎么来的?(attention 应该是初始化的吧?巴拉巴拉瞎说
14. 有了解过最近那些超长文本大模型的预训练吗?(没有了解具体原理,但是应该就是加大数据训练长度, 用外推更好的位置嵌入吧?)
15. 你说到外推性,那你了解常见的提高外推能力的方式吗?(主要还是位置编码吧? 给他讲解了一下 ALIBI 这个方式)
16 讲一下你对旋转位置编码的理解。
17 位置和注意力分数的曲线是什么样子的呢?(一条向上的抛物线,位置越远注意力越小)
18. 这个曲线会不会和三角函数一样呢?(我觉得如果是用 Transformer 原本的位置嵌入可能会吧。。。。其他的应该不会?)
19 回到我们刚刚说的数据处理, 你能不能用代码实现一下看看?(自己电脑没装 Python  pytorch,就用 Cpp 写,简单写了个逻辑, 随机数有点问题,也跑不通,大概说了一下方式)
在写个反转链表
反问:
全部评论
老哥现在开发和大模型岗位投递意向是五五开吗?
2 回复 分享
发布于 03-12 14:20 北京
反问了具体做什么内容, 偏工程还是科研。自己表现如何。
点赞 回复 分享
发布于 03-12 13:04 北京
已经开始等待CEO面了
点赞 回复 分享
发布于 03-12 16:05 北京
Mark,明早面😡
点赞 回复 分享
发布于 03-14 14:19 北京
我也面了...但听着好像就是让我主要去处理数据(我很菜无论文无实习
点赞 回复 分享
发布于 03-14 17:16 北京
实习整这么难
点赞 回复 分享
发布于 03-18 16:15 广东
大佬投了多久收到电话的
点赞 回复 分享
发布于 03-19 21:18 广东
佬,面试官应该问的是flash attention吧
点赞 回复 分享
发布于 04-25 14:46 上海

相关推荐

10-29 13:41
已编辑
武汉大学 Web前端
希望被捞的劳伦斯很超脱:再想想觉得问的挺简单的,感觉不是kpi面,是真想要,系统学一下以后应该就能答出来。
查看9道真题和解析
点赞 评论 收藏
分享
理想汽车 - 大模型算法实习生(长期有效,HC丰富,校招也开放ing)职位1-描述【大模型推理(Reasoning)与通用Agent AI】:- 研究通用大模型逻辑推理算法;- 研究o1的训练方案,搜索空间的探索与self-play的训练;- 研究Agent AI算法,助力实现L3智能;职位2-描述【大模型推理(Inference)优化】 :- 研究大模型推理阶段的KV cache 优化算法;- 研究分布式GPU训练优化算法,包括但不限于负载均衡、显存优化等;总结:大模型推理方向,GPU资源丰富,实习+论文,我全都要!我们能提供:1.技术沉淀:参与大模型技术研究,培养解决技术难题的能力。2.实战经验:参与真实业务场景的落地和上线。3.论文产出:发表高水平论文,培养顶会写作能力。4.成长支持:Mentor指导,重视成长,和优秀的人做有挑战的事。我们期待的你:必备项:- 专业背景:计算机、数学、人工智能等相关专业的在校生,统计和强化学习相关方向优先;- 基础能力:理论功底扎实,熟悉LLM、NLP相关算法,精通transformer和RL等相关算法优先。- 工作态度:主动积极,自驱能力强,具有创新意识。加分项:(没有也没关系,我们更看重潜力)5.实习时长:能够长期实习,长期合作。6.竞赛大佬:ACM/OI大神,代码能力出众。7.学术研究:在ML顶会发表论文,研究能力出众。8.相关经验:有大模型推理、模型优化、大模型框架优化和强化学习等相关工作经验。工作地点:- 北京朝阳望京心动了?赶紧砸简历过来吧!📧 简历投递:xuhao12@lixiang.com 简历要求:邮件名及简历标题命名为“姓名-学校-专业-实习时长”和我们一起,驰骋未来吧!🚗
投递理想汽车等公司10个岗位
点赞 评论 收藏
分享
16 46 评论
分享
牛客网
牛客企业服务