腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
CUDA
根据
条件
填充
较小
的
数组
cuda
假设我有一个
数组
X = [1,2,3,4,5,6,7,8,9,10] 有没有可能创建更小
的
数组
并
根据
某些
条件
填充
它们。例如,如果我想将X中
的
数字分隔成如下所示
的
数组
divisibleByTwo = [2,4,6,8,10]divisibleByFour = [4,8== 0) divisibleByTwo.emplace_back(X[i]);
浏览 2
提问于2019-03-04
得票数 0
4
回答
如何将
数组
拆分为在
条件
下存储
的
更小
的
数组
?
arrays
、
ruby
、
split
红宝石2.4我有一个字符串
数组
=> ["a", "b", "g", "e", "f", "h","i"] 如何
根据
条件
将
数组
拆分为
较小
浏览 5
提问于2017-07-07
得票数 1
回答已采纳
1
回答
你如何迭代一个固定
的
CUDA
数组
?
c++
、
arrays
、
memory
、
cuda
,而在
CUDA
中,您必须告诉它(通过<<<...换句话说,您可以让一个
CUDA
内核运行10,000次,这意味着上面的代码将适用于任何最多N= 10,000
的
数组
(当然,对于
较小
的
数组
,您是在浪费掉在if (tid < N)上
的
周期)。
根据
的
说法,当线程块正在运行时,迭代器将是因此,如果我想运
浏览 2
提问于2014-06-19
得票数 1
回答已采纳
2
回答
不理解与_shared_内存中
的
结构
数组
相关
的
cuda
中
的
此警告
cuda
我
的
代码运行良好,但我不明白这个警告。struct facet_
cuda
{IS_Vector_
cuda
normal;IS_Vector_
cuda
是一个具有默认构造函数
的
类。在全局函数中,我在共享内存中创建一个面
数组
,由块中
的<
浏览 2
提问于2013-11-27
得票数 2
回答已采纳
1
回答
如何
根据
一个元素上
的
条件
更新
数组
中
的
一个元素?
php
、
match
、
associative-array
、
key-value
我有一个关联
数组
的
数组
,其names (这是assoc
数组
的
键之一)如下所示:现在我有了另一个更大
的
数组
,其中一个键是names。'=>'3'},{'id'=>'90ks21','names'=>'Red','value
浏览 0
提问于2015-06-15
得票数 1
2
回答
在
CUDA
5中对全局设备内存进行自动越界检查?
cuda
、
indexoutofboundsexception
我最近安装了
CUDA
5(如果重要的话,我正在使用Visual Studio2010学习版)。当我试图在内核中
的
全局内存设备阵列上执行越界读访问时,
CUDA
现在给我一个错误(错误30‘未知错误’)。我想知道这个看似自动越界
的
错误检查是否是
CUDA
5
的
新功能。我不记得在早期版本中见过它。谢谢, Aaron
浏览 0
提问于2012-12-13
得票数 1
1
回答
使用共享内存计算点间距离
python
、
cuda
、
numba
我试图计算所有点之间
的
距离(公制加权)。为了加快速度,我在gpu上并通过
cuda
和numba完成了这个操作,因为我认为它更易读和更容易使用。我有两个一维点
数组
,想要计算同一
数组
中所有点之间
的
距离以及两个
数组
之间
的
所有点之间
的
距离。我编写了两个
cuda
内核,一个只使用全局内存,我已经验证了它使用cpu代码给出了正确
的
答案。就是这个。@
cuda
.jit def gpuSameSample(A,arrSu
浏览 0
提问于2019-07-28
得票数 1
回答已采纳
1
回答
不同
的
CUDA
版本有不同
的
构建规则?
cuda
、
nvidia
我想在我
的
CUDA
代码中指定是使用
CUDA
构建规则版本4.2还是
CUDA
构建规则版本5进行编译。 我正在寻找一个类似的
CUDA
构建规则版本
的
宏。
浏览 0
提问于2013-04-28
得票数 2
回答已采纳
1
回答
在
CUDA
中重新排列
数组
cuda
我有以下问题要在
CUDA
上实现:用C实现
的
简单代码可以是: { ++pcount1;} 我将如何在
CUDA
中实现此功能?我可以使
浏览 0
提问于2014-06-06
得票数 0
1
回答
在
CUDA
图中使用循环
cuda
、
gpu
、
nvidia
、
scheduling
、
cuda-graphs
A->B->C A->B->Cwhile循环可以执行3至2000次-关于循环应该停止
的
信息由内核C生成。由于执行与多个调用相对
较小
的
内核有关,
CUDA
图听起来是个不错
的
主意。然而,我见过
的
CUDA
图实现都是线性
的
或树状
的
,没有循环.通常,如果不可能使用循环,那么长度为2000
的</em
浏览 3
提问于2022-01-17
得票数 1
回答已采纳
1
回答
Numba -
CUDA
内核中
的
共享内存未正确更新
python
、
cuda
、
numba
考虑下面的内核,它计算x中小于或等于y中相应元素
的
元素数。@
cuda
.jit i =
cuda
.grid(1)b =
cuda
.to_device(np.ara
浏览 2
提问于2022-01-28
得票数 0
回答已采纳
3
回答
在JavaScript中处理大型(12K+行)
数组
javascript
、
json
、
indexeddb
、
web-sql
我将其转换为JSON
数组
,并通过JSONP加载它(必须运行客户端)。在数据集上执行任何类型
的
查询都需要几秒钟
的
时间才能返回一个
较小
的
、经过过滤
的
数据集。我目前正在使用JLINQ进行过滤,但实际上我只是循环遍历
数组
,并
根据
条件
返回一个
较小
的
集合。 webdb或indexeddb会让我更快地进行过滤吗?有没有你知道
的
解决这类问题
的
教程/文章?
浏览 0
提问于2012-05-08
得票数 14
回答已采纳
2
回答
Tensorflow:索引在
CUDA
_1D_KERNEL_LOOP(索引,nthread)操作用户中表示什么
tensorflow
我在tensorflow层
的
几个标准操作(如 )中看到,
CUDA
_1D_KERNEL_LOOP(索引,nthread)代码是向前和向后传递
的
一部分…… 我认为这里
的
“索引”在某种程度上与底部
的
要素地图坐标有关
浏览 21
提问于2016-09-13
得票数 2
1
回答
从numpy到张量
的
即插即用
python
、
numpy
、
pytorch
假设我有一个相同大小
的
张量列表,这些张量可以沿着一个维度连接起来,比如0。是否有任何命令torch.cat或torch.stack或任何numpy命令在适当
的
地方进行连接?另外,如果我想把一个矮小
的
ndarray转换成张量。如果我执行以下操作,在任何给定
的
时间,内存中是否存在两个副本?我正在处理一个庞大
的
数据集,它
的
一个副本在任何时候都可以存在于内存中。
浏览 2
提问于2018-06-11
得票数 1
2
回答
当我运行fit函数时,我
的
内核一直在jupyter笔记本中死去。
machine-learning
、
jupyter-notebook
当我运行fit函数tensorflow版本2.6.0时,我
的
内核就会死掉import os但我
的
内核仍在死去learning_rate_reduction = ReduceLROnPlateau(monitor
浏览 3
提问于2021-11-30
得票数 0
1
回答
推力copy_if装置主机
c++
、
cuda
、
thrust
在尝试执行以下操作时,在实例化推力
的
模板时,我会收到一个编译时错误: IsEntrySelected(rootLayer)); IsEntrySelected
的
定义通过将结果放在GPU上
的
中间device_vector缓冲区中,而不是直接复制到主机缓冲区,我已经能够使用相同
浏览 1
提问于2016-04-26
得票数 0
回答已采纳
1
回答
在数据自动化系统中,一个字符实际上需要多少内存?
c++
、
c
、
cuda
在我
的
CUDA
内核中,我需要很多索引,都在小于256
的
范围内。为了节省内存和内存带宽,我计划将这些索引放在char中而不是int中。(这里不存在内存合并问题,因为所有内核
的
索引都是相同
的
。)
浏览 4
提问于2015-03-24
得票数 2
回答已采纳
2
回答
就地重新排序
数组
cuda
我正在研究一种使用
CUDA
的
模拟算法,最终解决了删除
数组
数据
的
问题。我可以使用thrust::scatter和两个
数组
而不是一个
数组
来做到这一点,但是它能就地做到这一点吗?
浏览 1
提问于2014-12-10
得票数 0
1
回答
在Numba中,如何调用运行在GPU上
的
递归函数?
python
、
python-3.x
、
recursion
、
gpgpu
、
numba
根据
文档,似乎支持调用递归函数。但是我用一个简单
的
例子来尝试它,它失败了: @
cuda
.jit out[0] = recursive(0) print(h_data[0]) 在这种情况下,我所要做
的
就是调用一个调用递归函数
的
函数。该函数调用自身10次,然后返回一个数字,该数字存储在给定
数组
中并返回给主机。 我期望主机接收
填充
<em
浏览 30
提问于2020-07-24
得票数 2
回答已采纳
1
回答
在画布WPF C#上绘制
数组
c#
、
wpf
我有一个项目,我应该做一个小游戏,你可以拖放小矩形到一个网格中,然后
填充
那个网格。我遇到了一个问题。建立一个网格并预先定义大小是没有问题
的
。但我需要一个新
的
网格在一个不同
的
大小时,目前
的
网格已被填补。 然后,我想起了我曾经用Java制作
的
俄罗斯方块游戏,在这个游戏中,网格是使用2d
数组
创建
的
,我们可以
根据
用户
的
输入来调整大小。问题是,我不知道是否可以使用WPF和C#在画布上“绘制”一个
数组
,或者是否
浏览 1
提问于2013-05-15
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
WPS表格XLOOKUP函数有什么用?如何使用?
如何在Julia编程中实现GPU加速
从头开始进行CUDA编程:线程间协作的常见技术
SUMPRODUCT函数这么好用,你居然不会用?
NumPy二元运算的broadcasting机制
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券