NVIDIA AI Developer
5.10 一面
1. 介绍lora
2. nvidia 多进程和线程 + 流(说了一个用MPS比较hack的做法, 面试官给出了一个线程 + stream的做法)
3. GPU上的存储, global memory, local memory, shared memory, register的大小, 带宽, 访存延迟大概是在什么级别
4. 手撕, cuda layernorm
1. 介绍lora
2. nvidia 多进程和线程 + 流(说了一个用MPS比较hack的做法, 面试官给出了一个线程 + stream的做法)
3. GPU上的存储, global memory, local memory, shared memory, register的大小, 带宽, 访存延迟大概是在什么级别
4. 手撕, cuda layernorm
全部评论
这个是实习嘛
请问纯英文吗
加油
哥们方便交流下吗
加油加油
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享