NVIDIA AI Developer
5.10 一面
1. 介绍lora
2. nvidia 多进程和线程 + 流(说了一个用MPS比较hack的做法, 面试官给出了一个线程 + stream的做法)
3. GPU上的存储, global memory, local memory, shared memory, register的大小, 带宽, 访存延迟大概是在什么级别
4. 手撕, cuda layernorm
1. 介绍lora
2. nvidia 多进程和线程 + 流(说了一个用MPS比较hack的做法, 面试官给出了一个线程 + stream的做法)
3. GPU上的存储, global memory, local memory, shared memory, register的大小, 带宽, 访存延迟大概是在什么级别
4. 手撕, cuda layernorm
全部评论
这个是实习嘛
请问纯英文吗
加油
哥们方便交流下吗
加油加油
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享