bg一段芯片厂推理框架开发实习一个推理框架开发的项目一面一面的面试官是搞算法的,可能对推理相关的内容了解的不多,主要是针对CUDA的内容问的,比如内存模型,加速方法等,不算深入。顺便还考了一个softmax的CUDA手撕。其他的就是针对简历上提到的一些工作进行了提问,因为面试官本身也了解不深入,所以算是给他回答一些疑惑。手撕除了上面说到的CUDA,还有LC19删除链表的倒数第N个节点。二面一开始就是对项目和实习进行了询问,属于聊天型的。然后从简历出发,考了一些八股,flash attention、attention的计算复杂度,llama模型结构,为什么注意力分数计算要除以根号d,KV cac...