Pycuda 2019.1，如何正确复制gpuarray？

、、、

Pycuda有一个长期存在的错误，它在复制时似乎不能保持顺序或步幅，例如： import numpy as npfrom pycuda import gpuarraynp_array = np.array([[1,2,3,4,5],[1,2,3,4,5],[1,2,3,4,5],[1,2,3,4,5]], order="F") gpu_array = gpuarray.to_gpusame. ravel also sho

浏览 14提问于2019-06-19得票数 1

1回答

如何从gpu内存地址创建PyCUDA GPUArray？

、、、

我正在使用PyTorch，并希望在PyCUDA的帮助下对张量数据做一些算法。我可以通过t获得库达张量t.data_ptr()的内存地址。我能以某种方式使用这个地址和我对大小和数据类型的知识来初始化GPUArray吗？我希望避免复制数据，但这也是另一种选择。

浏览 2提问于2018-07-20得票数 3

回答已采纳

1回答

memcpy_htod和to_gpu在Pycuda中的差异？

、、、

我正在学习PyCUDA，在阅读关于pycuda.gpuarray的文档时，我对pycuda.driver.memcpy_htod (也是_dtoh)和pycuda.gpuarray.to_gpu (也是根据gpuarray ，.get()。例如，将self的内容转换为数组或新分配的numpy.ndarray。如果数组是给定的，则它必须具有正确的大小(不一定是形状)和dtype。这么说，.get()的实现方式与pycuda.drive

浏览 2提问于2013-11-17得票数 5

回答已采纳

2回答

PyCUDA内存寻址:内存偏移？

、、、、

在pycuda中可以做同样的事情吗？

浏览 3提问于2011-04-20得票数 1

回答已采纳

2回答

Pycuda搞乱numpy矩阵转置

、

为什么转置矩阵在转换为pycuda.gpuarray时看起来会有所不同？from pycuda import gpuarrayimport numpy data_gpu = gpuarray.to_gpu(data.T) print "data\n&

浏览 4提问于2011-08-01得票数 5

回答已采纳

1回答

基于pyCUDA的随机数生成

、

我想用pyCUDA生成随机数。为此，我使用了在Kaggle虚拟机上运行的以下代码：import time import pycuda.autoinitd_x = rng.

浏览 0提问于2019-03-20得票数 1

回答已采纳

1回答

PyCUDA: GPUArray.get()返回无法访问的数组

、、

为此，我使用了pycuda.gpuarray.sum()函数。import pycuda.gpuarrayb = gpuarray.to_gpu(a)c = c.getprint(c[0]) #Error, Index error - too many indices for array print(c.shape) #Prints (), empty tuple 如何将

浏览 17提问于2020-12-10得票数 1

回答已采纳

1回答

如何将CUDA核函数中的核输入数据结构与pycuda中的参数输入联系起来

、、、

我正在编写一个cuda内核，以便在pycuda中将rgba图像转换为灰度图像，下面是PyCUDA代码：import matplotlib.pyplot as pltimport pycuda.autoinitfrom pycuda.compiler import SourceModule 0.114f*color.z);

浏览 0提问于2018-01-08得票数 0

回答已采纳

1回答

用cuSOLVER计算奇异值分解

、、、、

使用代码和作为参考，我设法做到了以下几点：import pycuda.driver as drvldvt = n u_gpu = gpuarray.empty((ldu, m),int(A), lda, int(S), int(U),

浏览 3提问于2015-10-30得票数 1

1回答

在Windows 7 64位上安装Pycuda 2013.1.1

、、

我在Ipython中运行了下面的代码：import pycuda.driver as cudaa_doubled*a_gpu).get() ## the line can't

浏览 3提问于2013-08-08得票数 1

1回答

对“发射资源过多”的解释

、、、

考虑以下Python代码：from pycuda import compiler, gpuarray }"""kernel_func(gpuarray.zeros执行此操作将提供： Traceback (most

浏览 11提问于2016-09-28得票数 2

回答已采纳

1回答

pycuda.driver中的pycuda ImportError

、、

我使用pycuda来做这个。ws_gpu.py test.dcm File "ws_gpu.py", line 2, in <module> File "C:\Python27\lib\site-packages\pycuda\gpuarray.py", line 3, in <module>

浏览 5提问于2013-01-24得票数 5

1回答

如何使用PyCUDA中的“预付费”功能

、

我在将正确的参数传递到 (和prepared_call)到时遇到了问题。我以这种方式理解错误信息，即我传递给PyCUDA的变量之一是一个long，而不是我想要的float32。from pycuda import driver, compiler, gpuarray, toolsimport numpy as np np.random.seed(23) data = np.random.randn(di

浏览 0提问于2011-08-05得票数 4

1回答

如何将上/下gpuarray转换为cublasStbsv所需的特定格式？

、、、

我目前使用pycuda和scikits.cuda来求解线性方程A*x = b，其中A是上/下矩阵。然而，cublasStbsv例程需要一种特定的格式。如果使用numpy，stride_tricks.as_strided可以很容易地做到这一点，但我不知道如何使用pycuda.gpuarray做类似的事情。任何帮助都将不胜感激，谢谢。我找到了pycuda.compyte.array.as_strided，但它不能应用于gpuarray。

浏览 2提问于2014-11-28得票数 1

回答已采纳

1回答

困惑使用scikits.cuda.cula

、、

这就是我想要做的： import pycuda.gpuarray as gpuarray_libcula.culaDeviceSgetrf(m，n，int(a)，lda，int(ipiv)) TypeError:只有长度-1数组可以转换为Python标量 a_gpu = gpuarray.to_gpuculaDeviceSgetrf status = _libcula.culaDevi

浏览 3提问于2012-08-31得票数 0

回答已采纳

1回答

使用指针从GPU复制具有pyCuda的数组

、、

我正在通过pycuda复制GPU上的一些数组，然后存储指向这些数组的指针。我如何恢复数据？dist = np.zeros(numPoints).astype(np.float32) distAddress = [gpuarray.to_gpu(dist).ptr for i in range

浏览 4提问于2016-03-05得票数 0

回答已采纳

1回答

尽管专门设置了float32，但cython float64错误

、、

我正在尝试将用户的@rkp solution实现到他们自己的question中，了解如何使用pycuda库通过cython来加速稀疏矩阵乘法(请注意，这是他们在帖子中的第二个解决方案)。在安装了pycuda、pymetis等并运行了它们完全相同的代码(在IDLE Python3.5.2中)之后，我得到了： TypeError: 'numpy.float64' object cannotbe interpreted as an integer 事实证明，产生这个错误的(可重现的)部分是： import numpy as n

浏览 26提问于2019-10-17得票数 1

回答已采纳

3回答

如何从PyCUDA中现有的numpy数组创建页面锁定内存？

，但不是如何移动(？)一个现有的numpy数组进入页面锁定内存。是否需要获取numpy数组的指针并将其传递给pycuda.driver.PagelockedHostAllocation？现在内存传输是页面锁定的，但是程序以以下错误结束：# -*- coding: utf-8 -*- import ct

浏览 5提问于2011-10-04得票数 1

3回答

driver.Context.synchronize() - -还需要考虑什么-a清理操作失败

、

2)我不明白如何使用/找到块的数量，我可以看到，大多数情况下，有人把(线程-1+点)/threads，但仍然不能工作。代码快照：import pycuda.autoinitimport cmathimpo

浏览 10提问于2012-09-04得票数 5

回答已采纳

1回答

从pycuda中的全局函数调用设备函数

、

我是PyCUDA的新手。我想从用__global__声明的函数中调用用__device__声明的函数。我如何在pyCUDA中做到这一点？import pycuda.driver as cuda import numpy as n import pycuda.gpuarray as gp d=gp.zeros(s

浏览 2提问于2012-08-10得票数 1

回答已采纳

点击加载更多