AI深度学习推理加速HPC类岗位-Nvidia面经

哈哈标题党了,我其实不是学生,分享一下我作为一名面试官常问的AI推理加速HPC岗位的问题~仅分享通用知识部分,项目部分因人而异这里省略

C++部分

1、为什么我们做C++项目的时候,需要写头文件?

2、讲出static关键字的一种应用场景

3、单例模式如何实现?

4、讲讲四种类型转换

5、拷贝构造函数中浅拷贝和深拷贝的区别?

6、一个类要去访问另一个类的private数据成员,该如何操作?

量化quantization部分

1、说说你知道的那些针对LLM的量化技法?

2、smoothquant为什么可以解决int8 LLM的accuracy问题?

3、bfloat16和fp16(half float point)同样内存大小,那么它们可以节约的内存大小应该是一样的吗?他们的优缺点主要有哪些?

4、量化怎么平衡精度和速度?

CUDA部分

1、讲讲shared memory bank conflict的发生场景?以及你能想到哪些解决方案?

2、CUDA里面如何分配GPU显存?为什么里面的参数是二级指针?

3、优化CUDA程序的访存效率,你可以想到哪些?

4、优化CUDA程序的计算效率,你又可以想到哪些?

大模型部分

1、有哪些encoder-only、decoder-only、encoder-decoder的模型?

2、随着seqlen的增加,你觉得encoder-only的模型和decoder-only的模型的计算量和访存量会是哪些变化趋势?为什么?

3、说说你知道的大模型训练or推理的常用优化手段

4、一般会对哪些大模型里面的算子做算子融合,说说你知道的

5、flash attention的原理讲讲?你认为为什么flash attention极大提升了训练速度?

6、paged attention的原理讲讲?你认为为什么paged attention极大提升了推理速度?它和flash attention的区别是什么?

以上呢,起始都是非常经典的问题,足够看出大家对AI推理加速HPC岗位的基础。

本人知道最近大家忙着准备实习面试和几个月后的秋招面试 ,同时很多学弟学妹深陷AI算法和后端开发的泥沼,认为只存在这俩职位,本人当初作为应届生的时候也是这样,但其实不然,AI深度学习推理加速HPC类岗位随着nvidia的股价暴涨,需求也是越来越大的,我从去年开始就帮助了很多同学了解这方面、加入这方面、着手实践项目,很多去年都成功拿到了offer,因此欢迎大家ping我,祝大家龙年工作如意~附一些截图,(本人大号为: 1987我不知会遇见你)

#牛客在线求职答疑中心##牛客解忧铺##实习##秋招#
全部评论
想问一下日常实习一般几面是全英文吗
1 回复 分享
发布于 05-16 17:58 江苏
哇,你的问题好专业啊!看起来你对AI深度学习推理加速HPC岗位有很深的了解呢。这些问题对于面试者来说,确实是很好的挑战。不过,作为一个AI,我可能无法回答所有的问题,但我会尽力帮助你理解一些概念。 1. 为什么做C++项目时需要写头文件? 头文件是C++程序中一个重要的组成部分,它包含了函数、类、变量等的声明。在C++中,头文件可以帮助程序员组织和管理代码,提高代码的可读性和可维护性。 2. static关键字的一种应用场景是什么? static关键字在C++中有多种应用场景,其中之一是在类中使用static关键字修饰成员变量,表示这个成员变量属于类本身,而不是类的实例。这样,无论创建多少个类的实例,这个成员变量都只有一个副本,并且可以被所有实例共享。 3. 单例模式如何实现? 单例模式是一种设计模式,其目的是确保一个类只有一个实例。在C++中,可以通过将构造函数和拷贝构造函数设置为私有,并创建一个静态的类实例来实现单例模式。 4. 四种类型转换是什么? C++中的四种类型转换包括:static_cast、dynamic_cast、const_cast和reinterpret_cast。每种类型转换都有其特定的用途,例如static_cast用于非多态类型的转换,dynamic_cast用于多态类型的转换,const_cast用于去除变量的const或volatile属性,reinterpret_cast用于将一种类型的指针转换为另一种类型的指针。 5. 拷贝构造函数中浅拷贝和深拷贝的区别是什么? 浅拷贝是指在拷贝一个对象时,只拷贝对象的成员变量的值,而不拷贝成员变量的指针。深拷贝是指在拷贝一个对象时,不仅拷贝对象的成员变量的值,还拷贝成员变量的指针。浅拷贝可能会导致多个对象共享同一块内存,从而产生问题,而深拷贝可以避免这个问题。 6. 一个类要访问另一个类的private数据成员,该如何操作? 在C++中,类的private数据成员是类内部的实现细节,不应该被外部访问。然而,有时确实需要访问另一个类的private数据成员。在这种情况下,可以通过友元(friend)来实现。友元是一个类或者函数,它可以访问另一个类的private和protected成员。 以上就是我对你提出的部分问题的回答,希望对你有所帮助。如果你还有其他问题,欢迎继续提问。
点赞 回复 分享
发布于 03-04 10:17 AI生成
楼主有整理相应的答案吗 求分享
点赞 回复 分享
发布于 03-06 18:20 江苏
大佬公众号搜不到
点赞 回复 分享
发布于 04-25 11:54 湖南
大佬,有给学生推荐的cuda项目吗?
点赞 回复 分享
发布于 05-10 10:08 辽宁

相关推荐

宁德时代校招面经‌宁德时代热管理工程师面经面试时长:25分钟面试流程:无笔试,只有一面,英语测评,智力测评(两个测评应该不刷人,我都乱写的)面试官配置:只有一位,应该是经理面试内容:面试体验非常好,面试官教了我专业之外的很多东西。1.如果领导给你个任务,你有7天的时间,你怎么分配?2.电池液冷板的流量是怎么考虑的?3.实习过程中你学到了什么?4.你觉得实习和学校最大的区别是什么?反问:1.用的什么软件,以及怎么应对在学校用的仿真软件和工作的软件不一样这个转变?面试官说用的floefd,然后又说:其实软件的学习都是次要的,你们校招生进来会培训软件的使用,同时工作中也会天天用软件,你更应该关注的是,怎么提出一个更新更好的想法,怎么让自己变得更有特色。你更应该着重去提升你的软实力,比如汇报能力,专业基础能力,以及工作的逻辑思维(提炼一个标准流程可以让自己按模式解决问题),再就是心态的转变,从学生到工作,在这个公司长期发展的计划?你和同事的差距怎么提升?借助哪些资源?宁德时代2025届校园招聘正式启动!公司介绍:宁德时代新能源科技股份有限公司是全球领先的新能源创新科技公司,致力于为全球新能源应用提供一流解决方案和服务。重视研发,研发能力涵盖材料研发、产品研发、工程设计、测试分析、智能制造、米哈游、信息系统、项目管理等各个领域。招聘岗位:国内乘用车事业部:国内乘用车销售代表、国内乘用车项目管理工程师电池系统开发部:电气开发工程师、机械设计工程师电池管理系统部:测试工程师、硬件工程师、软件工程师(BMS)21C创新实验室:智能微网商业模式开发工程师、智能微网算法开发工程师制造基地支持部:电气工程师(海外)、机械工程师(海外)系统先进解决方案部:电气工程师电芯先进解决方案部:化工电气设计工程师、电气工程师面向人群:毕业时间2024年9月到2025年12月的毕业生招聘流程:网申-测评-面试(部分岗位会有AL面试和笔试环节,具体请以通知为准)-签约【内推码】DSQbdScQ(内推简历优先筛选~)简历投递:https://app.mokahr.com/m/campus-recruitment/catlhr/142197?recommendCode=DSQbdScQ&hash=%23%2Fjobs#/jobs投递的朋友留下姓名和岗位~我会跟进~
宁德时代
|
校招
|
超多精选岗位
点赞 评论 收藏
分享
评论
11
139
分享
牛客网
牛客企业服务