前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >CUDA编程.加法(双变量)

CUDA编程.加法(双变量)

作者头像
云深无际
发布于 2021-03-12 06:41:36
发布于 2021-03-12 06:41:36
6500
举报
文章被收录于专栏:云深之无迹云深之无迹

我们首先新加入一个项目

选择CUDA

注意默认是有代码的,我们删除掉

注意看两种头文件的引用方式

果然加进来了环境变量

再看看这个

写个加法函数,最后加法书存储在一个指针里面,指示内存的地址

因为结果在设备内存中,不显式的有结果。

接下来写下这样的代码


和所有的代码写法是一致的,一开始就定义我们接下来要用的所有的变量。

设备以及GPU的。

malloc这种函数,玩C的C++的,都不陌生。这里cudaMalloc就是同样的用法,记得这种函数是对偶使用,需要记得释放内存。

这个d_c是一个作为输出指针变量的设备显存指针

这样的调用方式是特有的内核调用语法

如果这个结果需要在主机上面使用,就必须把结果从设备复制到主机

用cudaMemcpy()函数完成

点击项目,来更改一下执行的目标

选择当前的项目

报错了,变量没有初识化

赋初值,然后重新编译。

成功~

在文章内,你可以对h_,d_这些变量的命名奇怪,只不过是为了区分变量的使用地方。

h是主机,d是设备。host,device~~~

这里要记住,对于每一个变量都要赋初值,让每一个值都是处于可控的状态!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-02-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 云深之无迹 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
cuda编程基础(建站)
3.项目生生成成功 .cu文件就是跑在GPU上面的文件。文件夹里面是自动生成的一些要依赖的库文件你可以不用管
全栈程序员站长
2022/07/31
8190
cuda编程基础(建站)
OpenCV二维Mat数组(二级指针)在CUDA中的使用
  CUDA用于并行计算非常方便,但是GPU与CPU之间的交互,比如传递参数等相对麻烦一些。在写CUDA核函数的时候形参往往会有很多个,动辄达到10-20个,如果能够在CPU中提前把数据组织好,比如使用二维数组,这样能够省去很多参数,在核函数中可以使用二维数组那样去取数据简化代码结构。当然使用二维数据会增加GPU内存的访问次数,不可避免会影响效率,这个不是今天讨论的重点了。   举两个代码栗子来说明二维数组在CUDA中的使用(亲测可用): 1. 普通二维数组示例: 输入:二维数组A(8行4列) 输出:二维数
一棹烟波
2018/01/12
3.3K0
OpenCV二维Mat数组(二级指针)在CUDA中的使用
CUDA编程.配置内核参数+API函数
为了我们获得并行能力,需要做一些配置CIA可以,这个配置在内核启动中写。它们指定了Grid中块的数量,和每一个块中线程的数量。每个快上面有512或者1024个线程。
云深无际
2021/03/12
7490
CUDA编程.配置内核参数+API函数
AI部署篇 | CUDA学习笔记1:向量相加与GPU优化(附CUDA C代码)
GPU并不是一个独立运行的计算平台,而需要与CPU协同工作,也可以把GPU看成是CPU的协处理器,因此当在说GPU并行计算时,其实是指的基于CPU+GPU的异构计算架构。在异构计算架构中,GPU与CPU通过PCIe总线连接在一起进行协同工作,CPU所在位置称为为主机端(host),而GPU所在位置称为设备端(device),如下图所示。
集智书童公众号
2022/01/05
2.8K0
AI部署篇 | CUDA学习笔记1:向量相加与GPU优化(附CUDA C代码)
CUDA并行编程概述
CUDA是英伟达推出的GPU架构平台,通过GPU强大的并行执行效率,为计算密集型应用加速,CUDA文件以.cu结尾,支持C++语言编写,在使用CUDA前需要下载 CUDA Toolkit
DearXuan
2022/01/19
8430
为什么深度学习模型在GPU上运行更快?
当前,提到深度学习,我们很自然地会想到利用GPU来提升运算效率。GPU最初是为了加速图像渲染和2D、3D图形处理而设计的。但它们强大的并行处理能力,使得它们在深度学习等更广泛的领域中也发挥了重要作用。
数据科学工厂
2024/07/05
1900
为什么深度学习模型在GPU上运行更快?
【玩转 GPU】我看你骨骼惊奇,是个写代码的奇才
欢迎开始学习GPU入门课程!GPU(图形处理器)在计算机科学和深度学习等领域有着广泛的应用。以下是一个适用于初学者的GPU入门学习课程目录,帮助了解GPU的基本概念、架构和编程:
不惑
2023/07/21
4880
Windows下使用VS Code搭建英伟达CUDA开发环境
首先,你需要从NVIDIA官网下载并安装CUDA Toolkit。确保选择与你的GPU兼容的版本,以及适合Windows操作系统的版本。下载地址:https://developer.nvidia.com/cuda-downloads
用户7353950
2024/07/05
3.1K0
Windows下使用VS Code搭建英伟达CUDA开发环境
【C++】基础:CUDA并行编程入门
当使用CUDA(Compute Unified Device Architecture)进行并行计算时,我们可以利用GPU(图形处理器)的强大性能来加速各种应用程序。
DevFrank
2024/07/24
8110
【AI系统】从 CUDA 对 AI 芯片思考
从技术的角度重新看英伟达生态,有很多值得借鉴的方面。本文将主要从流水编排、SIMT 前端、分支预测和交互方式等方面进行分析,同时对比 DSA 架构,思考可以从英伟达 CUDA 中借鉴的要点。
用户11307734
2024/11/27
1120
cuda教程[新手入门学编程]
大家好,我是架构君,一个会写代码吟诗的架构师。今天说一说cuda教程[新手入门学编程],希望能够帮助大家进步!!!
Java架构师必看
2022/03/22
3.1K0
cuda教程[新手入门学编程]
2020-10-21CUDA从入门到精通
在老板的要求下,本博主从2012年上高性能计算课程开始接触CUDA编程,随后将该技术应用到了实际项目中,使处理程序加速超过1K,可见基于图形显示器的并行计算对于追求速度的应用来说无疑是一个理想的选择。还有不到一年毕业,怕是毕业后这些技术也就随毕业而去,准备这个暑假开辟一个CUDA专栏,从入门到精通,步步为营,顺便分享设计的一些经验教训,希望能给学习CUDA的童鞋提供一定指导。个人能力所及,错误难免,欢迎讨论。
爱笑的架构师
2020/10/28
7280
2020-10-21CUDA从入门到精通
CUDA编程之线程模型
一个kernel结构如下:Kernel<<>>(param1, param2, …)
AI异构
2020/07/29
2.8K0
CUDA编程之线程模型
CUDA编程(机械编程)
参考了很多大神的内容,并非完全原创,只是为了查漏补缺,记录自己的学习过程。个人水平有限,错误难免,欢迎讨论。
全栈程序员站长
2022/08/01
1.1K0
CUDA编程(机械编程)
cuda 并行计算(cuda并行程序设计pdf)
上一篇博客主要讲解了怎么去获取核函数执行的准确时间,以及如何去根据这个时间评估CUDA程序的表现,也就是推算所谓的内存带宽,博客的最后我们计算了在GPU上单线程计算立方和的程序的内存带宽,发现其内存带宽的表现是十分糟糕的,其所使用的内存带宽大概只有 5M/s,而像GeForce 8800GTX这样比较老的显卡,也具有超过50GB/s 的内存带宽 。
全栈程序员站长
2022/07/31
1.1K0
cuda 并行计算(cuda并行程序设计pdf)
《GPU高性能编程 CUDA实战》(CUDA By Example)读书笔记
写在最前 这本书是2011年出版的,按照计算机的发展速度来说已经算是上古书籍了,不过由于其简单易懂,仍旧被推荐为入门神书。先上封面: 由于书比较老,而且由于学习的目的不同,这里只介绍了基础
用户1148523
2018/01/09
2.9K0
《GPU高性能编程 CUDA实战》(CUDA By Example)读书笔记
浅析GPU计算——cuda编程
        在《浅析GPU计算——CPU和GPU的选择》一文中,我们分析了在遇到什么瓶颈时需要考虑使用GPU去进行计算。本文将结合cuda编程来讲解实际应用例子。(转载请指明出于breaksoftware的csdn博客)
方亮
2019/01/16
2.6K0
讲解CUBLAS_STATUS_NOT_INITIALIZED解决
在使用CUDA加速库时,特别是在使用CUBLAS库进行GPU加速的线性代数运算时,有时我们可能会遇到CUBLAS_STATUS_NOT_INITIALIZED错误。这个错误通常表示CUBLAS库未正确初始化导致的问题。在本篇文章中,我们将深入探讨这个错误的原因,并给出解决方法。
大盘鸡拌面
2023/12/21
2.3K0
快来操纵你的GPU| CUDA编程入门极简教程
2006年,NVIDIA公司发布了CUDA(http://docs.nvidia.com/cuda/),CUDA是建立在NVIDIA的CPUs上的一个通用并行计算平台和编程模型,基于CUDA编程可以利用GPUs的并行计算引擎来更加高效地解决比较复杂的计算难题。近年来,GPU最成功的一个应用就是深度学习领域,基于GPU的并行计算已经成为训练深度学习模型的标配。目前,最新的CUDA版本为CUDA 9。
机器学习算法工程师
2018/07/27
5.1K0
快来操纵你的GPU| CUDA编程入门极简教程
windows cuda安装_虚拟机 cuda
到 https://developer.nvidia.com/cuda-downloads (旧:URL )去下载。在安装的时候一定要自定义安装,否则将会安装很多无用的东西。安装的选项,可以选择不更新驱动程序。
全栈程序员站长
2022/09/21
2.5K0
windows cuda安装_虚拟机 cuda
推荐阅读
相关推荐
cuda编程基础(建站)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档