1987我不知会遇见你

03-17 10:14 已编辑上海交通大学深度学习

关注

AI深度学习算法推理加速CUDA HPC类岗位-英伟达面经

前几天才面了下nvidia，面试官问了一堆底层问题，好多没答上来...

这次记录下，欢迎大家一起讨论...

哈哈标题党了，我其实不是学生，分享一下我作为一名面试官常问的AI推理加速HPC岗位的问题~仅分享通用知识部分，项目部分因人而异这里省略

C++部分

1、为什么我们做C++项目的时候，需要写头文件？

2、讲出static关键字的一种应用场景

3、单例模式如何实现？

4、讲讲四种类型转换

5、拷贝构造函数中浅拷贝和深拷贝的区别？

6、一个类要去访问另一个类的private数据成员，该如何操作？

量化quantization部分

1、说说你知道的那些针对LLM的量化技法？

2、smoothquant为什么可以解决int8 LLM的accuracy问题？

3、bfloat16和fp16(half float point)同样内存大小，那么它们可以节约的内存大小应该是一样的吗？他们的优缺点主要有哪些？

4、量化怎么平衡精度和速度？

CUDA部分

1、讲讲shared memory bank conflict的发生场景？以及你能想到哪些解决方案？

2、CUDA里面如何分配GPU显存？为什么里面的参数是二级指针？

3、优化CUDA程序的访存效率，你可以想到哪些？

4、优化CUDA程序的计算效率，你又可以想到哪些？

大模型部分

1、有哪些encoder-only、decoder-only、encoder-decoder的模型？

2、随着seqlen的增加，你觉得encoder-only的模型和decoder-only的模型的计算量和访存量会是哪些变化趋势？为什么？

3、说说你知道的大模型训练or推理的常用优化手段

4、一般会对哪些大模型里面的算子做算子融合，说说你知道的

5、flash attention的原理讲讲？你认为为什么flash attention极大提升了训练速度？

6、paged attention的原理讲讲？你认为为什么paged attention极大提升了推理速度？它和flash attention的区别是什么？

以上呢，起始都是非常经典的问题，足够看出大家对AI推理加速HPC岗位的基础。

本人知道最近大家忙着准备实习面试和几个月后的秋招面试，同时很多学弟学妹深陷AI算法和后端开发的泥沼，认为只存在这俩职位，本人当初作为应届生的时候也是这样，但其实不然，AI深度学习推理加速HPC类岗位随着nvidia的股价暴涨，需求也是越来越大的，我从去年开始就帮助了很多同学了解这方面、加入这方面、着手实践项目，很多去年都成功拿到了offer，因此欢迎大家ping我，祝大家龙年工作如意~附一些截图

全部评论

推荐最新楼层

牛客978617443号

上海杉达学院 C++

大佬你好，请问公众号是什么？

2 回复分享

发布于 03-07 14:32 上海

牛客125465453号

111 行业研究

狠狠的赞了

点赞回复分享

发布于 03-27 15:30 北京

whats_your_name

集美大学 C++

给一下答案啊

点赞回复分享

发布于 05-10 17:26 广东

啊实打实大苏打实打实的

四川省成都市青苏职业中专学校保险理赔

用英文面试吗

点赞回复分享

发布于 10-01 15:23 广东

10-29 10:17

十月还可投央国企汇总

中海石油 10月30日截止中国邮政 10月30日截止中国石油 10月30日截止中国能建 10月31日截止中国电子云 10月31日截止……想要进央国企，做好充足的准备很重要。牛牛整理了【2025国央企校招 求职宝典】，包含招聘信息/笔试/面试等全流程，助力高效备战央国企！一站式解决国央企求职难题，不收费，点击下方链接或扫码，邀请2位同学组团，即可一起免费领取！🔴 你将获得：✔️ 国央企招聘信息合集，不错过任何一个上岸机会✔️ 笔试真题+全面解析，摸清考察点，提高正确率✔️ 面试经验+套路，还原面试现场，掌握回答技巧拿offer，别犹豫，点击马上领取>>https://www.now...

点赞评论收藏

分享

11-06 11:32

复旦大学 C++

美团线下投递的，给我发“前端/移动端”的笔试，要做吗？我不知道这笔试是不是所有岗位通用的，只对前端/移动端有用的话就不做了。（意向是cpp开发）

投递美团等公司10个岗位

点赞评论收藏

分享

11-09 09:29

中国科学院大学算法工程师

【快手】大模型小型化算法实习生招聘

工作岗位：快手-AI平台-大模型小型化算法实习生工作地点：北京市海淀区西二旗中路29号元中心岗位要求：● 数理要求: 熟练掌握线性代数，概率论，信息论，凸优化等基础知识；了解矩阵论, 随机过程等● 框架要求: 精通PyTorch，熟练大模型并行框架的应用，包括 DeepSpeed，Megatron-LM● 代码要求: 精通Python● 对模型加速的算法研究有浓厚的兴趣，特别是针对LLM和SoRA等前沿模型的推理加速探索● 有论文发表经验优先，提供算力支持对创新idea的研究和应用岗位职责：● 负责快手内部AIGC大模型的推理部署效率优化需求，包括但不限于Diffusion采样时间优化，Dif...

投递快手等公司10个岗位 >

点赞评论收藏

分享

11-14 19:00

北京联合大学机器学习

26实习投递记录11.10-11.15

周一投完这周共5个面试 面完3个 时间冲突放弃1个 周五还剩1个力扣和数据结构没怎么刷先上战场了 面试中目前失败一个（写了65%）研一下到现在学了半年CUDA和TensorRT构建推理引擎 各类模型的高性能算子和高性能推理还缺乏实践 更深的TVM，分布式的deepseed和汇编没时间了 现在迷茫了 要学的很多且可能学完依旧找不到 #高性能计算#  #高性能计算面经#  #HPC高性能计算工程师#

点赞评论收藏

分享

11-08 23:25

Momenta 11月还有hc的岗位

11月还没投的看看这几个岗位吧 目前还有些hc，其他岗位在泡池子or发offer了已经重要岗位提示：端到端算法工程师深度学习算法工程师感知算法工程师决策规划算法工程师前端开发工程师系统架构与集成工程师（德语）系统架构与集成工程师（日语）offer就和抢演唱会票一样，抢完第一波之后等回流了，大佬拿着再多意向书，最后也只能签一个，，越厉害的，拿的offer越多，且都是非线性增长的，只要上面的人释放完意向，紧接着链式反应，大家都会有有offer的，其实最难的不是offer，而是进入了公司，发现累的要死，很多同学进入了工作后，朋友圈就没有更新过了，所以大家在签约的时候一定要打听清楚！ 目前的重点还...

Momenta公司福利 285人发布

点赞评论收藏

分享

19 186 评论

全站热榜

正在热议

# 25届秋招总结 #

294890次浏览 2586人参与

# 如果不工作真的会快乐吗 #

58497次浏览 505人参与

# 北方华创开奖 #

25926次浏览 279人参与

# 地方国企笔面经互助 #

3649次浏览 8人参与

# 美团求职进展汇总 #

1325430次浏览 12437人参与

# 选完offer后，你后悔学本专业吗 #

19106次浏览 139人参与

# 百度开奖 #

157656次浏览 944人参与

# 国央企薪资爆料 #

6917次浏览 50人参与

# 学历or实习经历，哪个更重要 #

50176次浏览 392人参与

# 正在实习的你，几点下班 #

51277次浏览 381人参与

# 米哈游求职进展汇总 #

175544次浏览 1456人参与

# 投递实习岗位前的准备 #

1178391次浏览 18386人参与

# 面试体验感最好的是哪家？ #

84842次浏览 842人参与

# 如何一边实习一边秋招 #

990894次浏览 12632人参与

# 得物求职进展汇总 #

65981次浏览 679人参与

# 求职遇到的搞笑事件 #

70440次浏览 575人参与

# 实习生应该准时下班吗 #

167243次浏览 1159人参与

# 网申一定要掌握的小技巧 #

5285次浏览 52人参与

# 0offer是寒冬太冷还是我太菜 #

896890次浏览 8003人参与

# 提前批简历挂麻了怎么办 #

146098次浏览 1942人参与

# 银行笔面经互助 #

82509次浏览 873人参与

# 腾讯求职进展汇总 #

195316次浏览 1637人参与

牛客网
牛客企业服务