我们首先新加入一个项目
选择CUDA
注意默认是有代码的,我们删除掉
注意看两种头文件的引用方式
果然加进来了环境变量
再看看这个
写个加法函数,最后加法书存储在一个指针里面,指示内存的地址
因为结果在设备内存中,不显式的有结果。
接下来写下这样的代码
和所有的代码写法是一致的,一开始就定义我们接下来要用的所有的变量。
设备以及GPU的。
malloc这种函数,玩C的C++的,都不陌生。这里cudaMalloc就是同样的用法,记得这种函数是对偶使用,需要记得释放内存。
这个d_c是一个作为输出指针变量的设备显存指针
这样的调用方式是特有的内核调用语法
如果这个结果需要在主机上面使用,就必须把结果从设备复制到主机
用cudaMemcpy()函数完成
点击项目,来更改一下执行的目标
选择当前的项目
报错了,变量没有初识化
赋初值,然后重新编译。
成功~
在文章内,你可以对h_,d_这些变量的命名奇怪,只不过是为了区分变量的使用地方。
h是主机,d是设备。host,device~~~
这里要记住,对于每一个变量都要赋初值,让每一个值都是处于可控的状态!
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有