理智的菜鸡GG了

06-30 15:02 浙大城市学院 Java 发布于北京

关注

想去大模型公司，求拷打简历

实习了一个月，纯打杂，准备跳槽了，想去大模型公司，不投算法，打算投系统方向，HPC/训练/推理这种，有机会嘛

全部评论

推荐最新楼层

美团_到家研发平台_前端开发(实习员工)

三快改成美团可能好点

1 回复分享

发布于 06-30 17:54 北京

理智的菜鸡GG了

楼主

浙大城市学院 Java

顶顶

1 回复分享

发布于 07-02 19:47 北京

360集团

校招火热招聘中

官网直投

理智的菜鸡GG了

楼主

浙大城市学院 Java

顶顶

点赞回复分享

发布于 06-30 15:48 北京

巴比Q了的LOLO很喜欢疯狂星期四

门头沟学院 Java

求简历模板

点赞回复分享

发布于 07-01 14:46 陕西

牛客385774307号

The Australian National University 算法工程师

HPC没啥希望……你去搞java或者数据库不行吗

点赞回复分享

发布于 08-28 10:06 安徽

08-29 16:58

门头沟学院 C++

清程极智大模型系统工程师凉经

清华系的AI infra创业公司，规模比较小，全是清华大佬，被狠狠吊打。一面八股transformer的模型结构有哪些位置编码？其特点是什么？GQAFlash Attention？Page AttentionDecoder-Only和Encoder-Decoder-Only模型相比有什么区别？手撕CUDA规约计算反问培养及管理体系二面二面应该是技术负责人了，项目拷打，问的特别细特别深，当时面试完人麻了，也没有录音记录，所以细节已经忘掉了。因为他们公司跟我实习的公司有业务合作，所以这位技术大佬比我还了解实习公司的业务，面试过程快扣出四室一厅了，毫无疑问的挂了。

查看4道真题和解析

点赞评论收藏

分享

08-22 15:38

香港科技大学（广州）人工智能

美团大模型岗位

笔试完简历筛选了好久好久今天看已经结束嘞现在大模型岗位是不是不怎么招人，还是要求巨高呀😭

投递美团等公司10个岗位

点赞评论收藏

分享

08-23 14:11

已编辑

南京大学 Java

科大讯飞-飞凡 HR面面经

请做个自我介绍。在每段实习经历中，你的成长和收获各是什么？哪段实习经历让你感觉与你未来的发展方向更一致？你未来的发展方向是想做技术专家还是有其他考虑？你曾经做过学校或项目团队的负责人吗？具体说明你参与的某个具体项目以及你在里面的角色和工作内容吗？为什么这个项目经历没有写在你的简历里？最近一年你感觉到自己最有成就感的一件事情是什么？你对AI大模型（如星火大模型、讯飞模型等）的擅长能力有哪些了解？选择Offer时，你考虑的最重要的三要素是什么？在你实习的公司中，哪家公司的工作时间最“卷”？你有没有目标公司？最后还有一个什么加面，总体流程就是 测评+两轮技术面+一轮HR面+一轮加面

查看12道真题和解析实习/秋招面经我的实习求职记录

点赞评论收藏

分享

08-15 11:06

已编辑

中国科学技术大学算法工程师

0814快手大模型训练推理一面秒挂

Kstar 大模型训练/推理岗  50分钟，面完直接躺地上睡觉zzz上来直接对着简历里的实习经历和项目问。1. 有哪些KV Cache Compression的形式？（这边我想先从自己的实习项目开始，再说别的，被对方直接打断“我没有问你的东西，我问有哪些方法”  态度感觉很不友好 ）  开始吟唱八股。2. MHA，MQA，GQA的概念，问怎样广播KV。之后问Multi-head Latent Attention与GQA的数据对应关系（给定hidden_status，Rope，MLA和GQA个数问MLA对应几个GQA），只知道MLA是低秩矩阵乘，但是具体怎么算没自己看过……没答上来。3. 问了20分钟项目里的KV Cache Sparse计算的细节和vLLM Triton的实现，自我感觉答得还可以。不过其中有一个，问我KV Cache Sparse计算为什么不用掩码，跟他说用掩码会导致不必要的GPU I/O和计算，不如直接传入稀疏矩阵，但对方一直觉得我说的有问题 = =||  4. DeepSpeed Zero123分别做了什么工作，吟唱完Zero1后被直接打断，让我算如果用Adam优化器，N个参数量的规模下Zero1如何给P个GPU分配数据。磕磕绊绊答出来，但是被说N个参数量还要考虑不同数据类型之间占用的内存不同FP32FP16balabala5. SmoothQuant原理，为什么要Smooth，参数如何设定（八股启动）  怎样判断一个模型是否适合SmoothQuant，如果用每层激活值分布判断，是看input channel还是output channel（答output，但是说完之后对方不置可否 = =||）6. AWQ和GPTQ原理，有何区别。7. 项目里为什么选用不同的量化方法，GPTQ和SmoothQuant对应什么场景。8. 蒸馏模型怎么做的，用了哪些技术（因为我用的模型是训练组给的蒸馏模型，只知道蒸馏的概念，细节不清楚）9. 分布式gpu通信原语  all together   all2all  （展开说了分别各自对应什么场景，结果被打断说“我只需要知道你告诉我这是通信原语就行”  觉得我说太多了…急着下班吗）反问环节有点幽默……我“请问您这边主要是做上游的微调或者modeling还是偏模型工程的推理加速？”  对方沉默一会儿回答“我们是算法”  把我尬住半天，，，面完1分钟看官网秒挂#秋招#

查看9道真题和解析

点赞评论收藏

分享

09-02 16:12

上海交通大学深度学习

记本人上周面试一小伙的全过程--AI推理优化方向

最近，正好在面试一些AI推理/大模型推理方向的校招同学，把面试过程按照对话的方式放出来，供各位看着玩玩。上周，领导又双来给了我一份简历。之前已经面过一次了，见此处领导：熊猫，这里是一个来自xxxx大学的同学，你看看有没有空去面试一下我：OK，我看一下(我看了后发现，这同学的简历虽然感觉写的一般，但是看起来工作量不少，实习应该有在认真工作，大模型推理相关技巧也有接触，在校招生里面，这些经历或许算得上top10%了，没准水平高过我，于是和上一期不一样，这次我是心怀忐忑地去“焦作人”）--------------------------------------分界线-----------------...

查看17道真题和解析

点赞评论收藏

分享

2 4 评论

全站热榜

正在热议

# 找实习多的是你不知道的事 #

1137277次浏览 16347人参与

# 我想象的实习vs现实的实习 #

165555次浏览 1472人参与

# 中兴秋招 #

30596次浏览 687人参与

# 美的求职进展汇总 #

78141次浏览 771人参与

# 正在实习的碎碎念 #

1080986次浏览 11863人参与

# 如果能重来，就业or读研你选哪个？ #

2681次浏览 39人参与

# 水滴校招 #

9347次浏览 405人参与

# 晒一晒我的offer #

5783404次浏览 73844人参与

# 深信服求职进展汇总 #

33195次浏览 268人参与

# 我的岗位说明书 #

5075次浏览 87人参与

# 投递实习岗位前的准备 #

996056次浏览 16266人参与

# 数据人的面试交流地 #

317954次浏览 6140人参与

# 投递几十家公司，到现在0offer，大家都一样吗 #

25729次浏览 272人参与

# 找不到实习会影响秋招吗 #

861476次浏览 10314人参与

# 机械制造面试记录 #

94540次浏览 1418人参与

# 产品面经 #

103655次浏览 1375人参与

# AI了，我在打一种很新的工 #

4002次浏览 198人参与

# 非技术岗是怎么找实习的 #

131619次浏览 1950人参与

# 能让你振作起来的一句话 #

23566次浏览 265人参与

# 小厂实习有必要去吗 #

21365次浏览 164人参与

# 你收到了团子的OC了吗 #

772239次浏览 8510人参与

# 如何一边实习一边秋招 #

750562次浏览 10339人参与

牛客网
牛客企业服务