bg:AI infra相关,但是3个志愿全挂,被到家的后端开发捞了,做的高性能计算相关。timeline:9.9一面 9.12二面 9.12 OC 4天速通。一面一面对简历上的所有项目进行了拷打。主要询问项目细节之类的。八股:Decoder-only和Encoder-only模型的优缺点介绍一下LLama模型CUDA编程模型CUDA内存模型使用共享内存时需要注意什么(bank conflict),怎么避免使用寄存器时需要注意什么,怎么避免GPU的多线程和CPU的多线程有什么区别flash attentionpage attention二面二面应该是技术Leader,能明显感觉到专业性很强。因为...