Loading [MathJax]/jax/input/TeX/config.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >CUDA阵列约简

问CUDA阵列约简
EN

Stack Overflow用户

提问于 2013-06-10 21:17:22

回答 1查看 2.4K关注 0票数 1

我知道有许多类似于这个问题的问题已经被解答了，但是我无法拼凑出来自它们的任何非常有用的东西，除了我可能是错误地索引了什么。

我试图将输入向量A上的顺序寻址简化为输出向量B。

完整的代码在这里是可用的http://pastebin.com/7UGadgjX，但这是内核：

__global__ void vectorSum(int *A, int *B, int numElements) {
  extern __shared__ int S[];
  // Each thread loads one element from global to shared memory
  int tid = threadIdx.x;
  int i = blockDim.x * blockIdx.x + threadIdx.x;
  if (i < numElements) {
    S[tid] = A[i];
    __syncthreads();
    // Reduce in shared memory
    for (int t = blockDim.x/2; t > 0; t>>=1) {
      if (tid < t) {
        S[tid] += S[tid + t];
      }
      __syncthreads();
    }
    if (tid == 0) B[blockIdx.x] = S[0];
  }
}

以下是内核启动语句：

// Launch the Vector Summation CUDA Kernel
  int threadsPerBlock = 256;
  int blocksPerGrid =(numElements + threadsPerBlock - 1) / threadsPerBlock;
  vectorSum<<<blocksPerGrid, threadsPerBlock>>>(d_A, d_B, numElements);

我得到了一个未指定的启动错误，我已经读到类似于分段错误。我一直在密切关注nvidia裁减文档，并试图将内核保持在numElements的范围内，但考虑到代码有多简单，我似乎遗漏了一些关键内容。

云点播特惠1元起

提供制作上传、存储、转码、媒体处理、媒体 AI、加速分发播放、版权保护等一体化的高品质媒体服务

EN

回答 1

Stack Overflow用户

发布于 2013-06-10 21:46:52

您的问题是，精简内核需要动态分配共享内存才能正确操作，但是内核启动没有指定任何。结果是越界/非法共享内存访问，从而中止内核。

在CUDA运行时API语法中，内核启动语句有四个参数。前两个是发射的网格和块尺寸。后两者是可选的，默认值为零，但指定动态分配的共享内存大小和流。

若要解决此问题，请按以下方式更改启动代码：

// Launch the Vector Summation CUDA Kernel
  int threadsPerBlock = 256;
  int blocksPerGrid =(numElements + threadsPerBlock - 1) / threadsPerBlock;
  size_t shmsz = (size_t)threadsPerBlock * sizeof(int);
  vectorSum<<<blocksPerGrid, threadsPerBlock, shmsz>>>(d_A, d_B, numElements);

免责声明:在浏览器中编写的代码，未经编译或测试，可自行使用。

这至少可以解决代码中最明显的问题。

票数 3

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/17036934

复制

相关文章

为什么我不建议你用 Select * ？

应用程序慢如牛，原因多多，可能是网络的原因、可能是系统架构的原因，还有可能是数据库的原因。

JavaFish

2019/10/17

1.7K0

为什么我不建议你写注释?

实际上,注释最多也就是一种必须的恶。若编程语言足够有表达力，或者我们擅长于用这些语言来表达意图，就不那么需要注释了，甚至也许根本不需要。注释的恰当用法是弥补我们在用代码表达意图时遭遇的失败，我用了失败一词，其实是说真的。注释总是一种失败，是因为我们无法找到不用注释就能表达这段代码含义的方法。如果你发现你的代码需要写注释，那么你就应该想想是不是有办法翻盘，用代码来表达。并不是不让你真的不用注释，而是有些时候，用注释是因为我们怕其他的开发者在我们的代码的时候，看不懂我们的代码从而去加注释，那么我们为什么不写出其他开发者一目了然的代码呢？

用户7386338

2020/05/29

1.2K0

我为什么不建议使用框架默认的 DefaultMeterObservationHandler

数据 import 对象框架内存

最近，我们升级了 SpringBoot 3.x，并且，升级后，我们全面改造了原来的 Sleuth 以及 Micrometer 监控，最新的 io.micrometer.observation.Observation 抽象将链路追踪以及指标监控（opentracing 和 opentelemetry 两个标准）结合，这样，我们就可以在链路追踪中，同时记录指标监控数据了。

干货满满张哈希

2024/05/25

1460

我为什么不建议使用框架默认的 DefaultMeterObservationHandler

为什么我的自动化流程不执行

很多人经常会有这个问题，为什么我的自动化流程不执行。如果你设置好了自动化流程，但是自动化流程却没有执行，请按照如下的顺序检查你的流程配置：

阿那个沫

2022/11/08

1.5K0

为什么我不建议自研BI系统？

数据安全数据分析编程算法企业

互联网的本质之一是信息共享，而共享的背后是各种原子粒度的数据流动。有以内容生产和内容消费匹配为目的的数据流动，比如搜索引擎；也有以人、货、场信息匹配为目的的数据流动，比如电商平台。

IT阅读排行榜

2023/02/13

7650

为什么我不建议你用 if-else ？

程序员想必都经历过这样的场景：刚开始自己写的代码很简洁，逻辑清晰，函数精简，没有一个 if-else，可随着代码逻辑不断完善和业务的瞬息万变:比如需要对入参进行类型和值进行判断；这里要判断下对象是否为 null；不同类型执行不同的流程。

开发者技术前线

2020/11/23

2.1K0

为什么我不建议你用 if-else ？

活久见，为什么SHOW TABLE STATUS总是不更新

https 缓存 html 网络安全 sql

前几天，QQ群里在讨论一个关于MySQL表统计信息迟迟不更新的问题。这个问题我复现了，下面是详细过程：

老叶茶馆

2020/06/24

2.1K0

DNS 系列（一）：为什么更新了 DNS 记录不生效？

tcp/ip 缓存 dns DNS 解析 DNSPod

我们在上网时如果想要访问到另一台机器上的内容，通常只需要直接输入一串地址，就能够准确访问到自己想要访问的网站。但是实际上这只是方便我们记忆的字符形式网络标识，真正让我们的机器和另一台机器进行沟通的是 IP 地址。只不过 IP 地址无论是输入还是记忆都非常麻烦，因此才诞生了域名系统。那么域名是怎么连接到那个服务器的 IP 呢？这就和我们今天要说的域名系统 DNS 有关了。

用户9996356

2022/08/25

4.8K1

我为什么不建议你使用Python3.7.3？

python 编程算法网络安全 javascript

之前使用Python的环境一直是Python3.7.3的，一直使用的很正常，没有什么毛病，直到最近做一个图片下载器的时候发现了问题。

云爬虫技术研究笔记

2019/11/05

2.1K0

我为什么不建议你使用Python3.7.3？

Python 为什么没有 main 函数？为什么我不推荐写 main 函数？

毫无疑问 Python 中没有所谓的 main 入口函数，但是网上经常看到一些文章提“Python 的 main 函数”、“建议写 main 函数”……

Python猫

2020/06/04

2.5K0

JAVA要死了吗？不！我来告诉你为什么！

java android spring jvm windows

我们看到“Java 死了吗？” 这个问题，年年都被抛出来，然而至今为止，从所有的第三方统计来看，Java 不仅活的很好，还在保持增长。虽然不断有新的语言面世，TIOBE 仍将 Java 评选为 2015 年度最热门语言，目前显示它相比 2014 年，用户增加了 5%，高于其他所有编程语言。

哲洛不闹

2018/09/14

7860

JAVA要死了吗？不！我来告诉你为什么！

为什么我不建议你通过 Python 去找工作？

这是读者“前进一点”在微信上问我的一个问题，我当时给他的回复是“Python 挺火的，学 Python 就好。”但当我在 B 站上看了羊哥的一期视频后，深感懊悔，觉得自己给出的建议是不负责任的。

黄啊码

2022/06/20

2.8K0

为什么我不建议你使用Java序列化

文件存储 java 数据结构编程算法存储

如今大部分的后端服务都是基于微服务架构实现的，服务按照业务划分被拆分，实现了服务的解耦，同时也带来了一些新的问题，比如不同业务之间的通信需要通过接口实现调用。两个服务之间要共享一个数据对象，就需要从对象转换成二进制流，通过网络传输，传送到对方服务，再转换成对象，供服务方法调用。这个编码和解码的过程我们称之为序列化和反序列化。

故里

2020/11/25

2K0

为什么我不建议你使用Java序列化

为什么我不建议你通过 Python 去找工作？

python 爬虫数据分析 java

这是读者“前进一点”在微信上问我的一个问题，我当时给他的回复是“Python 挺火的，学 Python 就好。”但当我在 B 站上看了羊哥的一期视频后，深感懊悔，觉得自己给出的建议是不负责任的。

沉默王二

2020/05/26

2.7K0

为什么我不建议你用去 “ ! = null " 做判空？

最终，项目中会存在大量判空代码，多么丑陋繁冗！如何避免这种情况？我们是否滥用了判空呢？

用户9239674

2022/01/22

1K0

为什么我把 Run 出来的 Apk 发给老板，却装不上！

android studio android

当我们在 Android Studio 中，直接 Run 一个项目时，AS 会自动打一个 Debug 的 Apk，并通过 ADB 命令，将 App 安装到我们连接的设备上。

CCCruch

2019/07/31

2.7K0

为什么我把 Run 出来的 Apk 发给老板，却装不上！

为什么我把 Run 出来的 Apk 发给老板，却装不上！

android studio android

当我们在 Android Studio 中，直接 Run 一个项目时，AS 会自动打一个 Debug 的 Apk，并通过 ADB 命令，将 App 安装到我们连接的设备上。

Android技术干货分享

2019/08/01

2.7K0

996的程序员们，为什么我不建议你买保险？

所以在医院，我们经常能看到，很多病人明明有医治的方案，却因为没有钱，只能眼睁睁地看着他离去。

Java团长

2019/08/22

2.8K0

996的程序员们，为什么我不建议你买保险？

Pandas我这个填充nan值为什么填充不上呢？

python 数据处理 nan pandas sf

前几天在Python钻石交流群【逆光】问了一个Python数据处理的问题，问题如下：请问一下，我这个填充nan值为什么填充不上呢

Python进阶者

2024/07/08

1220

Pandas我这个填充nan值为什么填充不上呢？

为什么我的数据不按顺序排序原来如此 | Java Debug 笔记

2023腾讯·技术创作特训营第三期

啵啵肠

2023/11/29

3270

相似问题

ntp什么时候更新时间？

10

如何阻止NTP更新系统时钟？

10

为什么CentOS没有NTP漂移文件？

10

在CentOS上将ntp更新为4.2.8p13

20

奇怪的NTP流量

10

活动推荐

助力在校大学生快速入门云计算，畅游云端

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例