CUDA面经
实习和秋招都面了一些高性能计算的岗,分享一点被问过的cuda八股
SIMT是什么
occupancy和什么有关,怎么控制
bank conflict粒度
GEMM分块大小受什么影响
float4读写gmem为什么更快
block能否被调度到不同sm上
常用卡的cache是多大
divergency对性能的影响
nvidia gpu的指令级并行
手撕矩阵转置
手撕向量外积
SIMT是什么
occupancy和什么有关,怎么控制
bank conflict粒度
GEMM分块大小受什么影响
float4读写gmem为什么更快
block能否被调度到不同sm上
常用卡的cache是多大
divergency对性能的影响
nvidia gpu的指令级并行
手撕矩阵转置
手撕向量外积
全部评论
大佬,这个赛道很卷吗?
感谢楼主分享,所以float4为什么会更快呀,这点一直挺困惑的
市面上会cuda的应该很少吧,感觉lz挺好找工作的?
楼主拿到哪家的offer了吗
大佬点技能树的时候,会学tvm推理引擎,训练框架这些吗![](https://uploadfiles.nowcoder.com/images/20220815/318889480_1660553763618/25C98751B489394CFB21CE09AE55BC97)
请问下大佬,面高性能计算岗,cuda的话怎样的项目算是比较有含金量
m
mark
相关推荐
![](https://static.nowcoder.com/fe/file/oss/1715327175846TQZPT.png)
点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享