高性能计算/推理框架/C++模型部署面经
C++
1. static的作用,修饰成员变量,成员函数。static全局变量和普通变量的区别。
2. 怎么只在堆上创建构造函数
3.右值引用
4.锁
5.lambda表达式
6.move forward
7.编译的过程 动态库和静态库的区别
8. new 和 malloc的区别, new的底层实现
9. 拷贝构造函数是传值还是引用,为什么要传引用。
10 线程安全的单例模式
11 智能指针,shared_ptr是不是线程安全的
12.vector的扩容机制?为什么要2倍扩容
13. C++内存模型
14.指针和引用的区别
15为什么构造函数不能是虚函数,为什么析构函数是虚函数
16线程间共享内存,什么时候用到条件变量,什么时候用到锁 ,有什么区别
17死锁条件,如何避免,lock_gard unquie_lock 区别
18C++怎么调用c语言封装的函数
19 多态实现,原理,虚函数表存的位置,注意别忘了模板多态,模板的偏特化
20 进程和线程的区别
21 大端小端 怎么判断,两种方法
高性能相关
1. opencl的运行流程
2. GPU架构
3. GPU全局内存和局部内存区别, 怎么更好利用局部内存。
4. Cache原理
5. 如何提高cache命中率
6. 通常优化的思路
7. 写opencl为什么要减少分支, 掩码
8. opencl 写kernel的主要参数有哪些
9. 计算密集型和访存密集型的区别
10.可分离卷积在GPU上为什么慢,为什么是访存密集型
11算子融合 conv+BN 融合的公式,为什么可以融合
12 推理框架中卷积的实现有哪些
13时间局部性和空间局部性
14 产生bank confict的原因和解决方法
15 TVM
深度学习相关
1. BN怎么计算,作用,推理和训练区别
2. depthwise 和 pointwise
3. mobile-net v1 v2 v3 的演进,ghostnet,以及其中的模块,比如se结构
4. yolo v1 v2 v3 SSD
5.全局池化一般用在哪里
6.模型蒸馏
7.量化的分类,int8量化的细节,不同的计算方式,对称非对称,优缺点, 量化感知训练,推理时的细节
8.dropout 训练和 推理区别
9.反卷积,空洞卷积
10.GIOU
11. softmax,为什么能分类
12 NMS的改进
刷题
1. 卷积
2.计算图
3.pooling
4. NMS
5.opencl 实现矩阵乘法, 向量求和