老实人胖虎

2021-08-06 19:49 已编辑上海大学 C++

关注

告诉你cuda共享内存的使用

想必大家都知道，cuda里面每一个block上有一块高速缓冲区，这就是提供给block里面各个线程使用的shared memory，那怎么使用这一块内存呢？

首先，shared memory分为固定分配方式和动态分配方式，就是上图的Static Shared Memory和Dynamic Shared Memory
1，固定分配
直接__shared__ int seme[5] ;这就是在每一个block里面分配5个int（20B）

__global__ void addKernel(int *c, const int *a)
{
   
	int i = threadIdx.x;
	 __shared__ int smem[5];
	smem[i] = a[i];
	__syncthreads();
	if (i == 0)	//0号线程做平方和
	{
   
		c[0] = 0;
		for (int d = 0; d<5; d++)
		{
   
			c[0] += smem[d] * smem[d];
		}
	}
	if (i == 1)//1号线程做累加
	{
   
		c[1] = 0;
		for (int d = 0; d<5; d++)
		{
   
			c[1] += smem[d];
		}
	}
	if (i == 2)	//2号线程做累乘
	{
   
		c[2] = 1;
		for (int d = 0; d<5; d++)
		{
   
			c[2] *= smem[d];
		}
	}

}

调用，启动的时候，block个数1，所以shared memory使用20B

addKernel << <1,size, 0, 0 >> >(dev_c, dev_a);

通过nsight可以看出，使用了20B的共享内存，并且是Static的；

2，动态分配
没错，就是在block里面声明，前面加上extern；

__global__ void addKernel(int *c, const int *a)
{
   
	int i = threadIdx.x;
	 extern __shared__ int smem[];
	smem[i] = a[i];
	__syncthreads();
	if (i == 0)	//0号线程做平方和
	{
   
		c[0] = 0;
		for (int d = 0; d<5; d++)
		{
   
			c[0] += smem[d] * smem[d];
		}
	}
	if (i == 1)//1号线程做累加
	{
   
		c[1] = 0;
		for (int d = 0; d<5; d++)
		{
   
			c[1] += smem[d];
		}
	}
	if (i == 2)	//2号线程做累乘
	{
   
		c[2] = 1;
		for (int d = 0; d<5; d++)
		{
   
			c[2] *= smem[d];
		}
	}

}

那在哪里指定大小呢？
原来是启动核函数的时候指定的第三个参数，之前使用多个流的时候，第四个参数绑定流的序号，第三个参数总是设为0，现在终于明白它的含义了

addKernel << <1,size, size*sizeof(int), 0 >> >(dev_c, dev_a);//第三个参数是每个block共享内存的大小

这几天正在准备写一篇关于cuda流的使用，然后会加上一些自己的学习总结，年轻，干就完了，奥利干！

CSDN博客搬运文章被收录于专栏

CSDN博客搬运

全部评论

推荐最新楼层

江南大学 C++

可以，不错哦

点赞回复分享

发布于 2021-09-30 08:44

今天 12:22

腾讯_大数据高性能开发(准入职员工)

腾讯内推腾讯面经

腾讯内推腾讯面经腾讯 微信后端 一二三面面经由于一二三面都是同一周进行的（具体业务部门暂不和牛友说啦），所以当时也没时间进行回顾，现在进行简要的回顾，不一定详细但尽可能把大致方向说一下一面：写题＋八股写题为一个给个文档，用IDE写完了粘贴进去。（题量不少2-3题左右，限时半小时，但无难题）八股：以计算机网络和操作系统为主，穿插问问一些实际的问题主要是：TCP 握手挥手，网络IO模型之类的，CPP的部分简单问题等，大家在牛客上都见过，都是常规的问题，实际的问题就是问Linux的一些命令和实际场景下怎么组合使用二面：写题＋项目同样起手一个文档，写题（都不是难题）项目深入的聊，整体流程，为什么这么设...

点赞评论收藏

分享

02-12 14:25

沈阳化工大学 Java

快手日常支付（电商）一面

能实习多久实习拷打：实习主要做的内容介绍一下怎么获取的对应的部署数据问了具体的表设计，以及不同的表存储的什么数据为什么你这个SQL会更快呢（一点点扣，一点点介绍聊了20分钟）为什么不在代码中对数据处理，而是通过一条sql的形式处理的呢（首先保证原子性、其次逐条判断效率低）ON DUPLICATE KEY UPDATE会有什么缺点呢（在mysql中适用，但是SQlserver不适用，对于使用了索引的update操作就没必要使用）离职检测会在什么时候触发为什么不是在人员离职那一时刻处理呢算法：字符串相加八股文：线程池参数核心线程数和最大线程数还有队列长度怎么安排呢mysql默认的隔离级别举了两个在...

卡卡罗特w：这就是百度的title 吗，全是大厂面试

查看13道真题和解析

点赞评论收藏

分享

01-14 00:29

新乡学院 PCB工程师

这份简历能找到硬件类工作吗

点赞评论收藏

分享

01-26 11:23

西安石油大学 C++

25应届无offer，求改简历

点赞评论收藏

分享

02-11 15:24

北京外国语大学 BD经理

网易有道-市场推广实习生（一面）面经

1、请做一个简单的自我介绍。2、说说你对市场推广实习生岗位的理解，以及它在市场部中的作用。3、如果让你开展一次用户调研，你会怎么做？4、在竞品分析方面，你有哪些经验和方法？5、讲讲你在创意制作与分析方面的思路和过往经历。6、你对网易有道的产品有多少了解，有没有特别喜欢的？7、当对接推广相关数据及产品需求时，遇到分歧你会如何处理？8、举例说明你是如何在工作中总结方法论的。9、反问环节。

查看8道真题和解析

点赞评论收藏

分享

评论

1

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 文科生还参加今年的春招吗 #

1980次浏览 21人参与

# 我的工作日记 #

50694次浏览 703人参与

# 选择和努力，哪个更重要？ #

37594次浏览 408人参与

# 如果再来一次，你还会学硬件吗 #

101327次浏览 1221人参与

# 小厂实习有必要去吗 #

28869次浏览 194人参与

# 如果公司降薪，你会跳槽吗？ #

42914次浏览 335人参与

# 机械人选offer，最看重什么？ #

68044次浏览 431人参与

# 大疆今年的机械笔试难吗？ #

34625次浏览 406人参与

# 大疆的机械笔试比去年难吗 #

63451次浏览 575人参与

# 影石Insta360求职进展汇总 #

106182次浏览 944人参与

# 24届市场营销薪资爆料 #

9046次浏览 62人参与

# 秋招拿一个offer可以躺平吗 #

125899次浏览 885人参与

# 秋招前后对offer的期望对比 #

222852次浏览 1667人参与

# 一人推荐一个值得去的通信/硬件公司 #

160337次浏览 1731人参与

# 长光卫星求职进展汇总 #

27045次浏览 180人参与

# 春招启动，你开始投递了吗？ #

48245次浏览 453人参与

# 机械人，你的第一份感谢信是谁给的 #

19875次浏览 258人参与

# 职场上哪些事情令人讨厌 #

12927次浏览 59人参与

# 你的秋招简历被谁挂了？ #

214495次浏览 2389人参与

# 我是XXX，请攻击我最薄弱的地方 #

11500次浏览 105人参与

牛客网
牛客企业服务