2021-11-07 17:01 北京信息科技大学 C++

关注

cuda 编程入门

GPU架构 TPC：流多处理器组成的小组
流多处理器：
warp ：每个块可能有128、256个线程，每32个线程称为一个warp。 warp是一个虚拟的并行结构，并行计算时，每个warp是一个基本的运算单元（执行相同的命令）warp是最基本的执行单位

alt

三级结构网格（grid）、块（block）、线程（Thread）

alt 块内同步的一些操作

alt

alt

alt 这个是半个warp去访问16个bank，现在可能有1个warp访问32个bank？

alt

alt

alt

alt 存在bank冲突

alt 没有冲突

cuda编程模型
- gpu和cpu是异构的，需要协同工作，
- cuda程序中既包含host程序又包含device程序，他们是分别在cpu和gpu上执行的
- host和device之间可以进行通信，进行数据拷贝

alt

alt

alt （实际上启动了一百多万个线程）

alt

alt

alt （1）二维的网格，有6个block，block也是二维的，在x方向有5个元素，在y方向有3个元素（15个线程），一共90个线程（最好是32的倍数）（3）block虽然有三个维度，但是z方向的维度是1，实际上还是个二维的block

alt

alt 内置变量：不用声明就能用。

alt

alt 同步函数，gpu上的计算是异步的，使用这个函数来操作等待。

alt alt

alt

GPU内存模型

alt

alt

alt

alt

alt 在SM里面

alt

alt

alt

alt 共享内存是按照bank来划分的（比如说32个字节一个bank

alt

alt

alt

alt

alt

alt

alt

alt

alt

alt 如果我们在传输数据的时候用这个在cpu上申请内存，速度比malloc快一倍

alt 这块申请的内存可以同时被cpu和gpu访问。需要gpu满足一定的计算能力才能使用

alt 也就是说必须等sorce的数据全部拷贝到dest，这个函数才会结束，执行下一个函数。

alt

alt

alt

cuda程序执行与硬件映射

alt

alt

alt

规约算法

alt 串行：使用for循环

alt 二分法

alt

alt 使用多个块减少资源浪费

alt 多个局部的规约需要全局的同步得到整体的规约

alt

alt

alt

alt

alt

alt

alt

alt

alt

alt

alt

alt

alt 浪费严重

alt

alt

alt

alt alt 跨bank，会造成数据的冲突

alt

alt

alt

alt

alt

alt

全部评论

推荐最新楼层

10-21 22:53

已编辑

门头沟学院 Java

普通家庭出身，我没靠关系，自己敲开了大厂的门

找工作，我没跟家里说一句难，全靠自己一点点扛1. 海投简历：像撒网捕鱼，没资源就靠 “量” 堆机会家里没人能帮着内推，咱也不是“关系户”也没渠道打听哪家公司在招人，我能做的就是 “广撒网”，如图所示截止目前投递到97家了，我还没记录线下招聘会投递的，实际早就破百了。每天下班就坐在出租屋的小书桌前，打开各个公司招聘网站，挨个填简历。有时候填到半夜，眼睛都花了，还得对着岗位要求改简历细节。投出去的简历大多石沉大海，偶尔收到 “不合适” 的自动回复，也只能自己跟自己说 “没事，下一个更合适”。遇到困难，没敢跟爸妈提，问就说，还在面试中，还没出结果。2. 硬扛困难：难过了自己消化，问题来了自己解决找工...

没有家庭托举的我是怎么找...

点赞评论收藏

分享

10-22 01:46

滴滴_测试开发工程师

学长，我得休息了，明天要面软*动力

昨天晚上发生了一件事情让我很触动，遂决定记录下来。QQ 上有人突然跑过来跟我讲，他也是学计算机的，最近在投简历，感觉不是很容易，想知道该怎么办。因为发现这人是我的好友，但却从来没有跟我聊过天，于是我迅速划开他的资料卡，望向他的好友分组，发觉我把他归类在大学校友一栏中，又问了一下发觉他是今年的校招生，于是找他要了简历想帮着看一下。映入眼帘的是一份十分标准的，包含教育背景、实习经历、技能特长、项目经验的研发岗简历，粗看内容很充实完善，没有什么大的格式问题，但简单扫了一圈，其中的有些内容还是让我皱了皱眉。*字节的是吧：我不是*字节的那就是图*的：对的*字节和图*是我校两个软件工程培训机构的名字，他们...

Frank_zhan...：社团里面顶着二次元头像的学长可能是整个大学里面可以接触到的技术水平最高的人了

点赞评论收藏

分享

09-30 18:51

字节跳动_后端开发(实习员工)

一天双意向！国庆最好的礼物

滴滴泡了一个月，jd泡了近两周终于不是0offer了，压力太大太大了

为了offer小猫拼...：好幸运呜呜，希望我也能泡出来呜呜呜

我的秋招日记

点赞评论收藏

分享

09-14 16:03

贵州民族大学银行管培生

凭借这个简历拿到2个offer了

谁说的双非没有出路😁

脾气小祖宗：这简历摸到都得狠狠地消毒液洗手😂

点赞评论收藏

分享

10-24 11:09

正浩创新EcoFlow_电力电子软件工程师(准入职员工)

正浩创新内推，正浩创新内推码

26届女硬件工程师丨正浩创新面经及流程9.1一面1.自我介绍2.有无相关电源设计项目或经历，并浅谈3.DCDC拓扑手撕（但是我当时没带纸笔所以口头描述），BUCK和BOOST，同步异步的区别和优缺点，同步电路的控制方式（施加什么PWM波形，如何控制MOS通断）4.项目中最有挑战性的部分，怎么解决的，然后会深挖这一部分再提问（这个问题出现的根本原因，下次如何避免）5.面试官说我专业其实不是很对口，不是电气工程专业，所以问的比较浅，大家仅供参考9.2收到笔试链接，非笔试，为性格测试9.5收到二面短信9.8 二面，没有技术问题，主要问了在校做过什么项目，调试遇到什么问题，除此之外有没有做过电源相关项...

点赞评论收藏

分享

评论

点赞

9

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 牛客树洞，我想对你说 #

19511次浏览 139人参与

# 大学最后一个寒假，我想…… #

56095次浏览 613人参与

# 快手技术岗信息交流阵地 #

8541次浏览 60人参与

# 你最近一次加班是什么时候？ #

94707次浏览 515人参与

# 除了主业以外，你还有哪些其他收入？ #

32708次浏览 299人参与

# 你最满意的offer薪资是哪家公司？ #

43174次浏览 214人参与

# 求职中的尴尬瞬间 #

7952次浏览 66人参与

# 应届生被毁约被毁意向了怎么办 #

48502次浏览 282人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

138372次浏览 886人参与

# 机械人避雷的岗位/公司 #

30802次浏览 250人参与

# 研究所笔面经互助 #

98413次浏览 550人参与

# 牛客周边新品开箱 #

12284次浏览 91人参与

# 国央企薪资爆料 #

123844次浏览 580人参与

# 如何KTV领导 #

74737次浏览 505人参与

# 硬件人的春招flag #

53568次浏览 435人参与

# 牛友的志愿填报指南 #

37176次浏览 189人参与

# 打工人锐评公司红黑榜 #

176670次浏览 1023人参与

# 怎么给家人解释你的工作？ #

16242次浏览 96人参与

# 得物app工作体验 #

30739次浏览 69人参与

# 国企还是互联网，你怎么选？ #

173390次浏览 1315人参与

# 25届非技术实习投递记录 #

132834次浏览 993人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务