2019-08-24 12:04 已编辑字节跳动_lark_后端研发工程师

关注

cuda编程三（核函数）

CUDA核函数：

要写在显示芯片上执行的程序。在 CUDA 中，在函数前面加上__global__ 表示这个函式是要在显示芯片上执行的,所以我们只要在正常函数之前加上一个__global__就行了：

// __global__ 函数 (GPU上执行) 计算立方和
__global__ static void sumOfSquares(int *num, int* result)
{
    int sum = 0;

    int i;

    for (i = 0; i < DATA_SIZE; i++) {

        sum += num[i] * num[i] * num[i];

    }

    *result = sum;

}

在显示芯片上执行的程序有一些限制，首先最明显的一个限制——不能有传回值，还有一些其他的限制，后面会慢慢提到。

执行核函数：

写好核函数之后需要让CUDA执行这个函数。

在 CUDA 中，要执行一个核函数，使用以下的语法：

    函数名称<<<block 数目, thread 数目, shared memory 大小>>>(参数...);

这里我们先不去并行，只是单纯地完成GPU计算，所以我们让block = 1，thread = 1，share memory = 0

 sumOfSquares<<<1, 1, 0>>>(gpudata, result);

计算完了，千万别忘了还要把结果从显示芯片复制回主内存上，然后释放掉内存~

    int sum;

    //cudaMemcpy 将结果从显存中复制回内存
    cudaMemcpy(&sum, result, sizeof(int), cudaMemcpyDeviceToHost);

    //Free
    cudaFree(gpudata);
    cudaFree(result);

最后我们把结果打印出来就大功告成了：

    printf("GPUsum: %d \n", sum);

之后我们再用CPU计算一下来验证一下上面的过程是否有错，这一步还是十分必要的：

    sum = 0;

    for (int i = 0; i < DATA_SIZE; i++) {
        sum += data[i] * data[i] * data[i];
    }

    printf("CPUsum: %d \n", sum);

完整程序代码：

#include <stdio.h>
#include <stdlib.h>

//CUDA RunTime API
#include <cuda_runtime.h>

#define DATA_SIZE 1048576

int data[DATA_SIZE];

//产生大量0-9之间的随机数
void GenerateNumbers(int *number, int size)
{
    for (int i = 0; i < size; i++) {
        number[i] = rand() % 10;
    }
}

//CUDA 初始化
bool InitCUDA()
{
    int count;

    //取得支持Cuda的装置的数目
    cudaGetDeviceCount(&count);

    if (count == 0) {
        fprintf(stderr, "There is no device.\n");
        return false;
    }

    int i;

    for (i = 0; i < count; i++) {
        cudaDeviceProp prop;
        if (cudaGetDeviceProperties(&prop, i) == cudaSuccess) {
            if (prop.major >= 1) {
                break;
            }
        }
    }

    if (i == count) {
        fprintf(stderr, "There is no device supporting CUDA 1.x.\n");
        return false;
    }

    cudaSetDevice(i);

    return true;
}


// __global__ 函数 (GPU上执行) 计算立方和
__global__ static void sumOfSquares(int *num, int* result)
{
    int sum = 0;

    int i;

    for (i = 0; i < DATA_SIZE; i++) {

        sum += num[i] * num[i] * num[i];

    }

    *result = sum;

}





int main()
{

    //CUDA 初始化
    if (!InitCUDA()) {
        return 0;
    }

    //生成随机数
    GenerateNumbers(data, DATA_SIZE);

    /*把数据复制到显卡内存中*/

    int* gpudata, *result;

    //cudaMalloc 取得一块显卡内存 ( 其中result用来存储计算结果 )
    cudaMalloc((void**)&gpudata, sizeof(int)* DATA_SIZE);
    cudaMalloc((void**)&result, sizeof(int));

    //cudaMemcpy 将产生的随机数复制到显卡内存中 
    //cudaMemcpyHostToDevice - 从内存复制到显卡内存
    //cudaMemcpyDeviceToHost - 从显卡内存复制到内存
    cudaMemcpy(gpudata, data, sizeof(int)* DATA_SIZE, cudaMemcpyHostToDevice);

    // 在CUDA 中执行函数 语法：函数名称<<<block 数目, thread 数目, shared memory 大小>>>(参数...);
    sumOfSquares << <1, 1, 0 >> >(gpudata, result);


    /*把结果从显示芯片复制回主内存*/

    int sum;

    //cudaMemcpy 将结果从显存中复制回内存
    cudaMemcpy(&sum, result, sizeof(int), cudaMemcpyDeviceToHost);

    //Free
    cudaFree(gpudata);
    cudaFree(result);

    printf("GPUsum: %d \n", sum);

    sum = 0;

    for (int i = 0; i < DATA_SIZE; i++) {
        sum += data[i] * data[i] * data[i];
    }

    printf("CPUsum: %d \n", sum);

    return 0;
}

结果如下：

全部评论

推荐最新楼层

11-20 17:20

山东理工大学网络工程师

字节HR面挂，故事终究是没能等来想要的结局

字节hr面后泡39天挂，下周又下周的泡，泡的身心俱疲呀要说没有心理准备是假的，其实看了这么多人的经历，对这个流程也大概有个认识过了这么久，结果也很显而易见了，只是感觉多少有些遗憾吧，已经走了这么远，或许这可能真的是人生仅有一次去字节的机会了，作为网工，字节那么多的网络类岗位，我不敢想象在里面能接触到多少这个领域的知识我并不像很多大佬一样，手握无数的机会，区区字节不要也罢——我并不具备这种自信和底气The testaments they toldThe moon and its eclipseAnd Superman unrollsA suit before he liftsBut I'm no...

秋招你被哪家公司挂了? 字节求职进展汇总

点赞评论收藏

分享

11-20 16:20

华中科技大学光通信工程师

【面经】新凯来|光学技术开发工程师

企业名称:新凯来 应聘岗位:光学技术开发工程师 offer状态:已保温 ———— 我印象中秋招里最积极的公司莫过于新凯来了。新凯来做高端半导体（懂得都懂）。我认为是一个在风口上的赛道，同时也有较好的背书。 ———— 流程: 笔试-技术面-主管面 1️⃣笔试 笔试的系统和华子一样。光学技术开放工程师主要考察了简单的物理光学、几何光学、激光原理的相关知识。单选和多选，难度不大。但需要认真准备。 2️⃣技术面（10.21） 印象很深刻，也挺有压力。 自我介绍+科研项目阐述。因为我的研究方向和应聘岗位方向有较大差距。面试官对此表示了一些疑惑和抗拒，过程中有感觉快要挂掉了hhh 自己立马整理了思路，说：...

查看5道真题和解析 offer帮选通信硬件人笔面经互助

点赞评论收藏

分享

10-28 15:45

门头沟学院 C++

刚收到海康电话，就红字了！秋招结束！

西南山：海康威视之前不是大规模裁员吗

点赞评论收藏

分享

10-27 11:26

字节跳动_测试开发工程师(准入职员工)

真的假的……

三年之期已到我的offer快到碗里来：9硕都比不上9本

点赞评论收藏

分享

11-19 23:55

哈尔滨理工大学汽车项目管理

南昌的9k要不要签呢

我在秋招中终于拿到了唯一的offer，南昌的公司给我开了9k（基本工资6k加绩效3k）。可是，家在西北，距离实在有点远，这让我很纠结。要不要签呢？虽然薪水看起来不错，但离家这么远，心里总是有些不安。希望有过来人能给点建议！

牛客创作赏金赛

点赞评论收藏

分享

点赞收藏评论

全站热榜

正在热议

# 25届秋招总结 #

248412次浏览 2016人参与

# 学历or实习经历，哪个更重要 #

41136次浏览 300人参与

# 北方华创开奖 #

22847次浏览 259人参与

# 地方国企笔面经互助 #

2559次浏览 6人参与

# 你最想要的公司福利是？ #

40099次浏览 126人参与

# 选完offer后，你后悔学本专业吗 #

10579次浏览 76人参与

# 面试题刺客退退退 #

137211次浏览 2092人参与

# 国企/银行/研究所公司爆料 #

89755次浏览 412人参与

# 应届生被毁约被毁意向了怎么办 #

27181次浏览 238人参与

# 一觉醒来，我觉醒了超级打工人系统 #

2916次浏览 35人参与

# 机械应届生薪资要多少才合适？ #

12398次浏览 60人参与

# 查收我的offer竞争力报告 #

16847次浏览 228人参与

# 校招入职后的感受 #

156973次浏览 1961人参与

# 你觉得第一学历对求职有影响吗？ #

14897次浏览 121人参与

# 没有实习经历，还有机会进大厂吗 #

805183次浏览 13814人参与

# 我的工作日记 #

21219次浏览 270人参与

# 不给转正的实习，你还去吗 #

1517123次浏览 16969人参与

# 寒假躺平还是提前实习 #

58463次浏览 438人参与

# 总结:哪家公司面试体验感最差 #

25775次浏览 129人参与

# 秋招OC许愿 #

226722次浏览 1872人参与

# 如何写一份好简历 #

602304次浏览 8444人参与

牛客网
牛客企业服务