百度提前批 25届 高性能计算研发工程师 一面
一、自我介绍
二、项目问答
- 做了哪些工作、遇到哪些困难、怎么解决
- 卷积与FFT的优缺点,在什么情境下选择卷积还是FFT会更快
- 核函数的TFLOPS是否测过
- 解释cuFFT进行批处理为什么快
- 是否了解深度学习
三、八股
- 单精度浮点数是多少位
- 一个单精度的数组,从前向后加,或者从后往前加,得到的结果是一样的吗
- 介绍一下C++的智能指针
- vector和数组的区别
- 递归和循环的优缺点,同一段代码 递归和循环哪个更快
- cuda:如何设计核函数的块数和线程数
- 1个block开多少线程受制于哪些资源
- 1个block开1024个可能会有什么问题吗,会对利用率有影响吗
- 使用共享内存需要注意什么,bank冲突概念,问题,避免
四、算法
cuda核函数:给定一个矩阵,将每一行进行累加