面试时长:50min面试内容:* 自我介绍* 实习内容介绍* cuda有哪些库函数* 训练和推理有哪些优化点* RDMA和DMA* pytorch显存如何管理* k8s对于worker信息的管理* k8s如何启动pod* k8s核心架构* docker的namespace和cgoups* 算法训练上有啥优化办法* 给定不同的硬件设备如何优化速度差异* 用户态和内核态如何转换* 数据包的传输具体过程* docker和k8s搭建集群* tvm和llvm* nvprof如何查看性能* nvlink原理* cpu内存和gpu显存的区别* host到device如何传输数据反问:* 公司架构