Loading [MathJax]/jax/input/TeX/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >cuda中矢量加法的故障分割

cuda中矢量加法的故障分割
EN

Stack Overflow用户
提问于 2014-11-05 03:07:34
回答 1查看 196关注 0票数 1

我在为cuda搞一个玩具程序。

我声明一个浮点数数组,将其传输到gpu,并将一个数字传输到该浮点数数组的每个元素,并将其传输回主机系统并打印该数组。然而,这是不可行的,这是给我分割的错误。

,这是代码

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#include <iostream>
using namespace std;

__global__ void kern(float *a, float *C){
    for (int i = 0; i < 3; i++) C[i] = a[i] + i;
}

int main(){
    float *A = new float[3];
    for(int i = 0; i < 3; i++){
        A[i] = i;
    }

    float * d;
    float * C;
    cudaMalloc(&C, sizeof(float)*3);
    cudaMalloc(&d, sizeof(float)*3);
    cudaMemcpy(&d, A, sizeof(float)*3, cudaMemcpyHostToDevice);
    kern<<<1, 1>>>(d, C);

    cudaMemcpy(&A, C, sizeof(float)*3, cudaMemcpyDeviceToHost);

    cout << A[2];

}

另外,我对Malloc不太熟悉,我大部分的经验都是使用cpp的,因此我对新的datatype[]感到更舒服;库达也有类似的经验吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-11-05 03:19:54

将此更改为:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cudaMemcpy(&d, A, sizeof(float)*3, cudaMemcpyHostToDevice);
cudaMemcpy(&A, C, sizeof(float)*3, cudaMemcpyDeviceToHost);

对此:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cudaMemcpy(d, A, sizeof(float)*3, cudaMemcpyHostToDevice);
cudaMemcpy(A, C, sizeof(float)*3, cudaMemcpyDeviceToHost);

而且,通过CUDA调用来存储返回代码总是更好--它们会让您更好地了解出了什么问题。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/26755683

复制
相关文章
CUDA编程.加法(双变量)
malloc这种函数,玩C的C++的,都不陌生。这里cudaMalloc就是同样的用法,记得这种函数是对偶使用,需要记得释放内存。
云深无际
2021/03/12
6340
CUDA编程.加法(双变量)
python中NumPy的矢量运算
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
多凡
2019/11/01
9630
依据矢量要素批量分割栅格为多部分:ArcPy
  本文介绍基于Python中ArcPy模块,基于具有多个面要素的要素类,批量分割大量栅格图像的方法。
疯狂学习GIS
2023/10/19
3310
依据矢量要素批量分割栅格为多部分:ArcPy
依据矢量要素批量分割栅格为多部分:ArcPy
  本文介绍基于Python中ArcPy模块,基于具有多个面要素的要素类,批量分割大量栅格图像的方法。
疯狂学习GIS
2023/10/19
4510
依据矢量要素批量分割栅格为多部分:ArcPy
PyTorch中to()和cuda()的区别
没有区别。 早期(张量和模型都要): x = x.cuda() model.cuda() 后来: device = torch.device('cuda') if cuda_available else torch.device('cpu') x = x.to(device) model = model.to(device)
小锋学长生活大爆炸
2022/03/29
1K0
PyTorch中to()和cuda()的区别
cuda中的二分查找
  使用背景 通常,在做高性能计算时,我们需要随机的连接某些点。这些点都具有自己的度量值,显然,度量值越大的值随机到的概率就会越大。因此,采用加权值得方法: void getdegreeSum(DG *g){ memset(degreeSum,0,sizeof(uint)*MAXSIZE); uint i,last=0; for(i=0;i<(g->n);i++){ degreeSum[i] = g->v[i].desum+last; last = d
用户1154259
2018/01/17
8850
高精度加法,模拟大数的加法运算
在处理特别大的数相加特别大的数的时候,long long不能直接通过加法算出结果的时候,可以通过高精度算法处理这些数的相加具体·思路如下;
莫浅子
2022/11/18
7350
事中故障处理(4)故障定位
故障恢复指恢复业务连续性的应急操作,很多故障是在不断尝试验证解决恢复的动作,所以故障恢复环节与故障定位环节有一定的交叠,或在这两个环节之间不断试错的循环,即故障恢复操作可能和故障诊断是同时,也可能是诊断之后或诊断之前。在故障恢复中我们通常采用已知预案下的恢复三把斧:“重启、回切、切换”、自动或手动触发系统架构高可用策略、临时决断的恢复动作,以及恢复后的信息传递。
彭华盛
2021/10/08
1.5K0
CUDA 的卸载_cuda怎么安装
对于刚接触人工智能领域不久的我而言,装 CUDA 等一些跑模型需要用到的工具是一件痛苦的事,稍不注意就会导致版本依赖问题,最终可能会需要你把前面安装的东西都卸载掉并重新下载,故本文记录如何卸载 CUDA 使得卸载干净。
全栈程序员站长
2022/10/03
2.9K0
CUDA 的卸载_cuda怎么安装
加法树还是加法链?
接下来,我们考虑4个32-bit有符号数相加该如何实现,其中目标时钟频率仍为400MHz。以UltraScale Plus系列芯片为目标芯片。
Lauren的FPGA
2020/09/27
3.3K0
加法树还是加法链?
3.4 事中故障处理(3)故障定位
故障定位指诊断故障直接原因或根因,故障定位有助于故障恢复动作更加有效。故障定位通常是整个故障过程中耗时最长的环节,定位的目标围绕在快速恢复的基础上,而非寻找问题根因,后者由问题管理负责。通常大部分可用性故障,要借助运维专家经验的假设判断或已知预案的执行得到解决,但仍有部分故障,尤其是性能、应用逻辑、数据故障需要多方协同与工具支持。故障定位的方法通常包括专家经验驱动的假设尝试、测试复现、预案启动、代码分析四种,这个过程涉及对日志、链路、监控、数据感知、知识管理五类工具。随着系统复杂性不断提升,依靠专家经验驱动的假设尝试准确率会下降,如何将数字化手段结合专家经验,融入到协同机制中,这考验故障定位场景的设计水平。
彭华盛
2021/09/14
1.7K0
CUDA 6中的统一内存模型
白嘉庆,西邮陈莉君教授门下研一学生。曾在华为西安研究所任C++开发一职,目前兴趣是学习Linux内核网络安全相关内容。
Linux阅码场
2020/07/02
2.9K0
补码加法运算溢出判断例题_补码加法溢出
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
全栈程序员站长
2022/11/08
1.2K0
矢量数据的处理
  矢量数据就是点、线、面和注记,不能是栅格,也不能是TIN等数据,矢量数据的处理和分析基本原理如下。
小孙同学
2022/01/17
2.1K0
矢量数据的处理
图论加法
在读到这个标题的时候,小伙伴是不是会觉得很疑惑,为什么图论能有加法?难道两个图可以加在一起?两个点可以加在一起? 在原来的数学范围是做不到的,但是如果是定义了一套规则对图论进行基础的数学计算,大家猜猜计算出来的是什么?我原本是在标题前面加上了超实数三个字,但是在开始写的时候重新看了袁萌老师的超实数的多篇文章之后发现我没有勇气在本文的标题前面加上了超实数,本文的引入其实是为了在做人工智能的时候的计算方便,而不是一个严谨的数学,这里的数学计算只是工具,里面的逻辑主要靠定义。 本文不会使用高深的数学知识,会用到的就一点集合和加法,大概有初中的知识就可以了解了。之所以不敢说小学是因为里面用了一点集合的东西,一点方程相关。
林德熙
2019/03/15
1.3K0
图论加法
加法生产
image.png 推荐语: 第三次工业革命并不是一句口号,实际上它已经悄然到来。这会给我们带来什么影响呢? 别的不多说,仅仅是信息技术和材料技术的突破性创新,就已经使我们对世界的认知和生产方式发生突变。例如现在大家热议的3D打印机,已经让我们对“定制化生产”感同身受。 工业社会中,规模经济曲线统治了生产,标准化和重复制造是企业最理性的选择。这里不难看出,一方面是小众市场始终难以被满足,另一方面,定制化逐渐与奢侈品画上等号,普通消费者只能望洋兴叹。 在第三次工业革命中,以开源技术为
腾讯研究院
2018/01/19
1.6K0
加法生产
那些网络中容易出现的故障
运维人最怕网络出故障。先抛开一些闲话不谈,网络故障从大体上来讲,有下面几种情况:
释然IT杂谈
2020/05/11
9890
【CUDA】cuda安装 (windows版)[通俗易懂]
本次安装参考了网上许多教程,结合自己的需求与理解,写下此篇博客,仅做本人总结使用。。
全栈程序员站长
2022/09/06
10.7K0
【CUDA】cuda安装 (windows版)[通俗易懂]
大数加法
语法:add(char a[],char b[],char s[]); 参数: a[]: 被乘数,用字符串表示,位数不限 b[]: 乘数,用字符串表示,位数不限 t[]: 结果,用字符串表示 返回值: null 注意:   空间复杂度为 o(n^2)   需要 string.h 源程序: #include <iostream> #include <string.h> using namespace std; void add(char a[],char b[],char back[]) { in
用户1154259
2018/01/17
1K0
大数加法
先是说一说对这道题的理解吧,对于数字运算,我们大都知道int是存在范围的,long也是有范围的,但是当面对数值超出范围的时候我们要怎么应对,大概就是这题的一个知识点吧。
忧愁的chafry
2022/10/30
8970
大数加法

相似问题

矢量加法CUDA

10

cuda中的矢量加法

10

矢量故障分割

52

矢量分割故障向量

30

没有CUDA代码的线程中的CUDA分割故障

24
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文