在结构上使用推力reduce_by_key_无法使用reduce_by_key编译推力代码_PyCuda使用Streams执行推力 - 腾讯云开发者社区

、

我是CUDA的新手，我正尝试在结构上应用reduce_by_key操作。// Number of elements with index = 0 thrust::equal_to

浏览 17提问于2020-04-29得票数 0

回答已采纳

1回答

推力/库达reduce_by_key误差？

、、

我面临着reduce_by_key函数的推力库的问题。在我看来，这好像是个窃听器，但我想在报告之前先确认一下。整个事情是编译使用visual 2010和nvcc在发布模式，64位。我在我的设备上生成了一个名为devData的随机数向量。然后，我只想使用reduce_by_key devData使用devIndices获得以下简化向量： devIndices = 0，1，.您可以使用参数k，它基本上设置元素的数量。Reduce_b

浏览 2提问于2015-08-12得票数 1

回答已采纳

1回答

按键减少设备阵列

、、

我使用reduce_by_key查找int2类型数组中的元素数，该数组具有相同的第一个值。例如，Array：<1,2> <1,3> <1,4> <2,5> <2,7> so no。我使用gdb运行了上面的代码，它报告了这个位置的分段错误。thrust::system::detail::internal::scalar::reduce_by_key > (keys_first=0x1304740000，keys_last=0x1304740010/

浏览 3提问于2015-06-11得票数 0

回答已采纳

1回答

关键重复次数少的thrust::reduce_by_key性能

、、、

我必须使用许多不同的键来减少数组的键数，这些键只偶尔重复一次：array = {1,2,3,4,5,6,7,8,9,10,11,12,13,14,...} result = {1,2,7,5,6,7,17,10,23,13,14} 在这里，使用thrust::reduce_by_key (或任何其他分段缩减方法

浏览 0提问于2012-02-23得票数 3

2回答

推力计数发生

、

可能重复：如果推力不能做到这一点，我如何使用内核来做到这一点？谢谢!

浏览 4提问于2012-07-19得票数 1

回答已采纳

1回答

如何防止thrust::reduce_by_key写入可分页内存？

、

我正在编写一个应用程序，它使用几个并发的CUDA流。当我的thrust::reduce_by_key调用似乎写入可分页内存时，我的其他流阻塞了。我认为返回值才是问题所在。can see in the profiler each operator writes 4 bytes to pageable memory *new_end = thrust::reduce_by_key

浏览 1提问于2020-07-15得票数 0

回答已采纳

1回答

库达/推力:如何对交错数组的列进行求和？

、、、

使用推力，可以对交错数组(即由向量支持)的行进行直加，如示例所示。// convert a linear index to a column indexstruct linear_index_to_col_indexdevice_vector<int> col_indices(C); // compute row sums by summing values wit

浏览 3提问于2015-12-04得票数 2

回答已采纳

1回答

基于CUDA的线路检测

、

为了得到线段，我正在跟踪(使用Bresenham的直线算法)，通过最小到最大点，并得到每个bin上的线段。当hough阈值很低时，当图像中有很多行时，trace_lines需要很长的时间才能完成。我在使用原子运算。是否有可能避免原子。我正在附加下面的代码。

浏览 2提问于2013-07-02得票数 1

1回答

推力CUDA查找每个组(段)的最大值

、、、、

所以结果应该是index = [2, 4, 5]我怎样才能用cuda推力得到它呢？我可以做sort -> reduce_by_key，但是效率不是很高。在我的例子中，向量大小> 10M，密钥空间约为1K(从0开始，没有间隙)。

浏览 1提问于2016-08-13得票数 3

回答已采纳

1回答

无法使用reduce_by_key编译推力代码

、、

我需要沿着矩阵的列和使用推力的行索引来最小值。我使用以下代码(从owl解决方案中复制)，但是在编译时遇到错误。我已经把它作为一个问题发布在了相应的git页面上。错误消息很多，我不知道如何调试它。我使用的是cuda-8.0，推力1.8版。device_vector<float> d_minima(Ncols); thrust::reduce_by_key

浏览 17提问于2019-01-15得票数 0

回答已采纳

1回答

从C++访问device_vector的最佳方式

、、、

我想知道从主机c++代码访问推力device_vector的最好方法是什么？我已经编写了一个cuda API来做基本的向量代数，因为我想构建一个解释器，类似于Matlab/Octave，其中向量存储在GPU上，可以轻松地进行reduce、reduce_by_key等计算。

浏览 1提问于2014-01-30得票数 0

2回答

带zip_iterator的推力zip_iterator误差

、

我通过压缩迭代器使用这些数组。然后，我需要减少能够计数，所以想要使用reduce_by_key。但是我做一个功能性reduce_by_key的所有尝试都是错误的。有人能告诉我我做错了什么吗。提前谢谢。thrust::make_tuple(my_zr,counter_2.begin())); thrust::reduce_by_keythrust::make_tuple(my_zr,counter_2

浏览 9提问于2022-02-21得票数 0

回答已采纳

1回答

在器件矢量上存储推力reduce_by_key的返回值

、、、、

我一直试图在设备矢量上使用推力函数reduce_by_key。在文档中，他们给出了host_vectors上的示例，而不是任何设备向量。我遇到的主要问题是如何存储函数的返回值。thrust::detail::normal_iterator<thrust::device_ptr<int> > > new_end; //THE PROBLEM new_end = thrust::reduce_by_keyhashValueVector.begin(),d_pathId.be

浏览 2提问于2014-02-20得票数 0

回答已采纳

1回答

如何在CUDA中获得推力device_ptr的偏移量？

、、

(ptrOffset); thrust::make_discard_iterator(), dev_ptr_offset, binary_pred, binary_op); 本例中的reduce_by_key我尝试使用thrust::r

浏览 28提问于2020-05-03得票数 0

1回答

使用较少内存的CUDA推力reduce_by_key

、、

我试图减少为用例计算reduce_by_key所需的内存。与值的数目(大约1600万)相比，我有相对较少的唯一键数(大约100到150)。

浏览 2提问于2015-08-26得票数 2

回答已采纳

1回答

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云