Numpy中大矩阵的内存效率多数投票单元 - 腾讯云开发者社区

python、numpy、scipy、sparse-matrix、theano

我在这方面研究了很多，但找不到解决这个问题的实际方法。我正在使用scipy创建csr稀疏矩阵，并希望从所有1的等价矩阵中减去此矩阵。在scipy和numpy表示法中，如果矩阵不是稀疏的，我们可以通过简单地编写1- MatrixVariable来实现。但是，如果Matrix是稀疏的，则不会实现此操作。我可以想到下面这个显而易见的解决方案：迭代整个稀疏矩阵，将所有零元素设置为1，将所有非零元素设置为0。但这将创建一个矩阵，其中大多数元素为1，只有少数元素为0，这不再是稀疏的，并且由于其巨大的大小无法转换为密集。有什么替代的和有效的方法可以做到这一点呢？谢谢。

浏览 3提问于2013-07-02得票数 3

1回答

苹果硅上高效/并行矩阵例程

python、numpy、matrix、scipy、scientific-computing

我在物理领域工作，作为我工作的一部分，我必须做大量的数值计算(“数字”)，其中的90+%涉及到大型矩阵的对角化。目前，我在Python中使用NumPy/SciPy；特别是numpy.linalg.eigh，或者scipy.sparse.linalg.eigsh，如果矩阵是稀疏的，并且我不需要所有的特征值/特征向量。我使用PyCharm和Anaconda，从来没有想过这些例程是如何实现的，以及它们是否有效。然而，我刚刚得到了一个新的MacBook和一个M1专业芯片，我认为这将是一个很好的时间来确保我正在做的是真正的优化！不幸的是，我对这些计算的“幕后”情况知之甚少。因此，我的问题是:如何安装

浏览 6提问于2022-06-04得票数 0

回答已采纳

3回答

使用numpy快速更新矩阵

python、arrays、numpy、file-io、matrix

我的问题是，我需要从一个文件中读取大约5000万行的格式 x1 "\t" x2 "\t" .. x10 "\t" count 然后用分量Aj = Sum (在所有行上) count * x_i * x_j计算矩阵A。我尝试了两种方法，每行读取文件行： 1)保持A为Python矩阵，并在for循环中更新： for j in range(size): for i in range(size): A[j][i] += x[j] * x[i] * count 2)将A设为numpy数组，并使用numpy.add更新： num

浏览 2提问于2015-01-23得票数 2

2回答

不改变稀疏性的枕叶稀疏矩阵的多重切片

python、numpy、matrix、scipy、sparse-matrix

在scipy中，当我将稀疏矩阵的一部分与只包含零的数组相乘时，结果是一个比以前少或同样稀疏的矩阵，尽管它应该是更多或同样稀疏的。将矩阵的部分设置为0或False的情况也是相同的： >>> import numpy as np >>> from scipy.sparse import csr_matrix as csr >>> M = csr(np.random.random((8,8))>0.9) >>> M <8x8 sparse matrix of type '<type 'numpy

浏览 2提问于2018-01-09得票数 0

2回答

如何在python中稀疏矩阵/数组

python、numpy、scipy

我在python中有一个简单的“矩阵”，我想对其进行稀疏处理： np.array([[5.72756493, 0. , 0. ], [2.86378246, 4.96021673, 0. ], [5.72756493, 3.30681115, 2.33826859]]) 我想将其简化为以下形式： np.array([[5.72756493, 0. , 0. ], [2.86378246, 4.96021673, 0. ], [0.

浏览 50提问于2019-09-17得票数 0

回答已采纳

1回答

如何将一个大的(10^6 * 10^6) Numpy稀疏矩阵转化为一个Scipy稀疏矩阵？

python、numpy、matrix、scipy、sparse-matrix

我有一个非常大的稀疏Numpy矩阵(类型为numpy.ndarray)。矩阵太大了，很可能必须存储在虚拟内存中。如何有效地将其转换为稀疏的枕木矩阵(来自scipy.sparse)(用于算术操作)？下面是dok_matrix的直接转换，这可能是由于内存问题而失败的。将dok_matrix更改为csr_matrix会导致相同的内存问题。 In [1]: N=int(1e6) In [2]: from scipy.sparse import dok_matrix In [3]: import numpy as np In [4]: mat=np.zeros((N,N)) In [5]: d

浏览 13提问于2022-08-19得票数 0

回答已采纳

1回答

通过较大的矩阵在子矩阵中迭代

python、loops、numpy、matrix

我寻找一种方法，我使用for循环可以迭代一个更大的矩阵，其中每个迭代将输出一个子矩阵的大小(行，颜色，深度) (6,3,3)。我的大矩阵存储为numpy矩阵，并且可能也希望每一次迭代都以这样的方式输出。 >>> import numpy as np >>> a = np.random.rand(6*3,3*3,3) >>> print a.shape (18, 9, 3) >>> print a >>> b 变量b应包含矩阵a中大小的所有子矩阵(6,3,3)，每个子矩阵不应与先前的矩阵重叠。

浏览 2提问于2017-03-15得票数 3

回答已采纳

2回答

序列化大型枕木稀疏矩阵的最佳方法是什么？

python、numpy、scipy、hdf5、pytables

我有一个大的枕木稀疏矩阵，占我系统总内存的90%以上。我想把它保存到磁盘上，因为构建矩阵需要几个小时. 我试过cPickle，但那会导致记忆爆炸. import numpy as np from scipy.sparse import lil_matrix import cPickle dim = 10**8 M = lil_matrix((dim, dim), dtype=np.float) with open(filename, 'wb') as f: cpickle.dump(M, f) # leads to a major memory explosio

浏览 1提问于2014-07-25得票数 2

回答已采纳

1回答

矩阵求和逻辑

python-3.x

我正在处理一个2D矩阵并找到元素之和，下面是我的逻辑： def calculateSum(a, x, y): s = 0; for i in range(0,x+1): for j in range(0,y+1): s = s + a[i][j]; print(s) return s def check(a): arr = [] x = 0 y = 0 for i in range(len(a)): row = [] y = 0 for j i

浏览 0提问于2019-01-25得票数 0

7回答

与常规的Python列表相比，NumPy的优势是什么？

python、arrays、list、numpy、numpy-ndarray

与常规的Python列表相比，的优势是什么？我有大约100个金融市场系列，我将创建一个100x100x100 =100万个单元的立方体数组。我将用每个y和z来回归(3个变量)每个x，以用标准误差填充数组。我听说对于“大矩阵”，出于性能和可伸缩性的原因，我应该使用NumPy而不是Python列表。问题是，我知道Python列表，它们似乎对我很有效。如果我迁移到NumPy，会有什么好处？如果我有1000个系列(也就是说，立方体中有10亿个浮点单元)会怎么样？

浏览 0提问于2009-06-15得票数 520

回答已采纳

2回答

将一个矩阵添加到另一个矩阵的切片中

python、numpy、matrix

假设我有一个矩阵X (1000x10)和一个矩阵Y (20x10)。我想高效地重复添加Y到X的每个(20x10)块(因此是50个块)。有没有一种有效的方法可以用numpy做到这一点呢？我不想使用np.repeat，因为原始矩阵很大，而且我想防止不必要的Y重复。有什么想法吗？

浏览 4提问于2017-08-06得票数 0

回答已采纳

4回答

具有Numpy的多重矩阵乘法

python、numpy、matrix

我有650个基于csv的矩阵。我计划使用Numpy加载每个文件，如下例所示： m1 = numpy.loadtext(open("matrix1.txt", "rb"), delimiter=",", skiprows=1) 有矩阵2.txt，矩阵3.txt，.，矩阵650.txt文件，我需要处理这些文件。我的最终目标是将每个矩阵相乘，这意味着我不一定需要维护650个矩阵，而只需要维持2个矩阵(1个正在进行，1个目前正在乘以我正在进行的矩阵)。下面是我对从1到n定义的矩阵的含义的一个例子: M1，M2，M3，…，Mn。 M1*M2*M3*.*

浏览 6提问于2016-03-05得票数 0

回答已采纳

2回答

使用内存映射缓冲区进行枕叶稀疏

python、numpy、scipy、sparse-matrix

我必须处理稀疏矩阵，它有时会非常大，接近或超过RAM容量。我还需要支持mat*vec和mat*mat操作。因为在内部，csr_matrix是3个数组( data、indices和indptr )，所以可以从numpy memmap创建csr矩阵。

浏览 0提问于2018-04-14得票数 1

回答已采纳

2回答

在NumPy中，根据相邻值计算值的惯用方法是什么？

python、arrays、numpy、vectorization

我被要求在二维数组/矩阵(行、列)中试验numpy计算值，其中这些值依赖于相邻的值。我承认，这不仅仅是将矩阵与标量或诸如此类的矩阵相乘，即使它可能被简化为一系列这样的步骤。尽管这是家庭作业，但我的问题所涉及的范围比仅仅向我提出解决办法的范围更广。我已经阅读了广播，即向量化，在numpy，我可以想象一种方式是实现这作为一个新的ufunc，并运行它的矩阵。但是，对于我可能面临的限制，我有点担心--与当前迭代期间计算的元素相比，numpy ufunc可以访问相邻元素吗？概念上： for x in columns: for y in rows: a[x, y] = a[x,

浏览 4提问于2015-10-20得票数 2

1回答

带有numpy.pad函数的python中的内存错误

python、arrays、numpy、out-of-memory、anaconda

我在python中读取了一个csv文件，并创建了一个4664605 x4数组。我想要一个矩阵。因此，我使用numpy.pad (wit常量= 0)函数来创建4664605 x 4664605矩阵。但我有以下错误消息：追溯(最近一次调用)：文件"C:\Users\Angelika\Eclipse\Projects\vonNeumann\vonNeumann.py"，第7行，在A_new = np.pad(A，(0，0)，(0,4664601))，“常数”，constant_values=(0)文件"C:\Anaconda\lib\site-packages\numpy

浏览 2提问于2016-08-25得票数 1

2回答

减少长时间运行的应用程序中的numpy内存占用

python、memory-management、numpy、garbage-collection

在我的应用程序中，生成了100个numpy数组(每个1000个复杂元素)，并填充了数据。然后经过多次迭代，数组元素被一次又一次地修改。在初始生成之后，系统监视器报告大约50 Mb的RAM使用率。虽然我没有生成任何新的数组，但每次迭代占用的空间都在以大约40Mb的速度增长。我学到了，垃圾收集器不处理numpy数组。因此，我假设我生成的一些用于操作数据的临时数组没有正确收集。不幸的是，说guppy.hpy().heap()并不能帮助分析numpy。我如何识别问题的根源，并在理想情况下使消耗在任意次数的迭代中保持恒定？我怀疑我在分配中描述的数组元素时可能会生成副本，然后这些数组元素就不会被垃

浏览 2提问于2012-09-14得票数 8

回答已采纳

3回答

如何反转numpy.where (np.where)函数

python、numpy、boolean、where、indices

我经常使用numpy.where函数来收集具有某些属性的矩阵的索引元组。例如 import numpy as np X = np.random.rand(3,3) >>> X array([[ 0.51035326, 0.41536004, 0.37821622], [ 0.32285063, 0.29847402, 0.82969935], [ 0.74340225, 0.51553363, 0.22528989]]) >>> ix = np.where(X > 0.5) >>> ix (array([0,

浏览 1提问于2012-03-01得票数 7

回答已采纳

2回答

numpy中不同行长的矩阵

numpy、matrix、theano

是否有一种方法来定义不同长度行的numpy中的矩阵(例如m)，但使m保持二维(即m.ndim = 2)？例如，如果定义m= numpy.array([ 1 ,2,3，4,5])，那么m.ndim =1。我理解为什么会发生这种情况，但我感兴趣的是是否有任何方法可以使numpy将m视为2D。一个想法是填充一个虚拟值，这样行就会变得同样大小，但是我有很多这样的矩阵，它占用了太多的空间。我真的需要m是2D的原因是，我和Theano一起工作，而得到m值的张量需要一个2D值。

浏览 3提问于2014-06-13得票数 2

回答已采纳

1回答

当有大量数据和内存不支持时，如何计算距离矩阵

machine-learning、python、matrix、memory

我正在处理一个数据矩阵，其中大多数变量是二进制或多级响应。我想要执行MDS算法，为此，我需要首先计算距离矩阵。我的数据集包含大约4,000,000个人，因此在计算上它超出了我的计算机的能力。如何有效地计算这个矩阵？

浏览 0提问于2022-08-31得票数 0

1回答

更改CUDA中多个单元格的值

cuda、pycuda

这必须是一个简单的问题，尽管我找不到答案。我正在写一个程序，它必须计算细胞自动机的状态，为了了解CUDA是如何工作的，我尝试先写一个非常简单的程序。它接受一个矩阵，每个线程必须在它的单元格和该单元格上下的单元格中递增一个值。所以，如果我给它下面的矩阵： [0 0 0 0 0 0 0] [0 0 0 0 0 0 0] [0 0 0 0 0 0 0] [0 0 0 0 0 0 0] [0 0 0 0 0 0 0] [0 0 0 0 0 0 0] [0 0 0 0 0 0 0] 我期望得到以下结果： [2 2 2 2 2 2 2] [3 3 3 3 3 3 3] [3 3 3 3 3 3 3] [3

浏览 0提问于2013-02-10得票数 0

回答已采纳

1回答

python矩阵乘法:如何处理非常大的矩阵？

python、numpy、matrix-multiplication

a = numpy.zeros((17770,5)) b = numpy.zeros((5,20000)) ma = numpy.matrix(a) mb = numpy.matrix(b) 就是ma.shape = (17770,5)，mb.shape = (5,20000)，都是numpy.matrix。我需要ma*mb。但是我得到了错误消息"ValueError: array is too big"。这些矩阵对于Python乘法是不是太大了？顺便说一句，我使用python2.6.6/32bit/3 3GB进行了测试

浏览 0提问于2011-08-20得票数 6

2回答

将numpy数组的rebin优化为任意二进制大小

python、arrays、numpy

我是从问题开始构建的。我正在使用发布在那里的解决方案重新绑定一个numpy数组，并为额外的部分添加一个小的附加项： from numpy import arange,append x = arange(20) x = x[:(x.shape[0]/bin)*bin].reshape((x.shape[0]//bin,-1)).mean(1) x= append(x,x[(x.shape[0]/bin)*bin:].mean()) 这是为了处理x.shape[0]的非除数桶。append将剩余单元格的平均值相加。问题是，我在这里做了很多数组，除了内存之外，这不可能是运行时高效的。有更好的办法

浏览 7提问于2016-12-06得票数 1

回答已采纳

1回答

numpy矩阵的最大元素/大小？

python、windows、memory-management、matrix、numpy

numpy矩阵的最大元素/情况是什么，或者numpy矩阵的最大大小是多少？上面的代码在变量矩阵size...so上返回内存错误，它依赖于什么环境(可用内存的顺序数量？)？ for ret in xrange(5000,7000,50): res = [] for x in xrange(ret): temp=[] for y in xrange(ret): temp.append(random.random()) res.append(temp) print "r" r = numpy.m

浏览 0提问于2011-07-20得票数 0

1回答

带numpy位运算问题的布尔矩阵

python、arrays、numpy、matrix、bitwise-operators

我使用2d numpy矩阵作为各种图的表示和遍历的邻接矩阵。这些都是未加权的图表，我只需要检查连接性，仅此而已。因此，我用1s来表示边，用0表示没有边。我承认，以下问题可能取决于许多因素-其中大多数都超出了我的理解范围。在1和0的两个矩阵(或真和假)之间执行位运算时，合适的d类型是什么？我还有第二个问题--对于这种情况，numpy甚至是正确的选择吗？我想知道是否有一个我不知道的python包，如果您只执行按位操作(没有算术)，那么它比numpy要好。谢谢。

浏览 1提问于2018-06-28得票数 0

回答已采纳

1回答

如何生成其元素在Numpy中数组指定的两个边界内的所有数组？

python、arrays、numpy

假设给出了两个整数数组min和max，它们具有相等的shape。如何生成用于所有min[indices] <= ar[indices] <= max[indices]的所有Numpy数组？我看过Numpy数组创建例程，但它们似乎都没有做我想做的事情。我还考虑从min数组开始，循环它的索引，添加1直到到达max中的相应条目，但是我想知道Numpy是否提供了更干净的方法。举个例子，如果 min = np.array([[0, 1], [2, 3]]) max = np.array([[0, 1], [3, 4]]) 那么，

浏览 5提问于2020-10-02得票数 0

回答已采纳

1回答

在Numpy有更快的方法吗？

python、numpy、numpy-ndarray、array-broadcasting

我想在numpy中生成一个3D矩阵。守则是： mean_value = np.array([1, 2, 3], dtype=np.float32) h, w = 5, 5 b = np.ones((h, w, 1), dtype=np.float32) * np.reshape(mean_value, [1, 1, 3]) print(b.shape) # (5, 5, 3) 是否有更快的方法来生成b？谢谢。

浏览 1提问于2019-11-08得票数 1

回答已采纳

1回答

在numpy数组上迭代时的平均

python、loops、numpy、multidimensional-array、mean

我有一个名为MEL of shape (94824 )的数据集，其中大多数实例都具有形状(99，13)，但有些实例的形状较小。它由(浮动) MEL频率组成。我试着把所有的值都放在一个空的数字矩阵中(94824，99，13)。所以有些实例是空的。有什么建议吗？ MEL type = numpy.ndarray for i in MEL type(i) = <class 'numpy.ndarray'> for j in i type (j) = <class 'numpy.ndarray'>

浏览 0提问于2018-12-11得票数 1

回答已采纳

1回答

Numpy:高级索引的转置结果

python、performance、numpy、memory-layout

>>> import numpy as np >>> X = np.arange(27).reshape(3, 3, 3) >>> x = [0, 1] >>> X[x, x, :] array([[ 0, 1, 2], [12, 13, 14]]) 我需要沿着0维对它进行求和，但是在现实世界中，矩阵是巨大的，我更愿意沿着-1维将它相加，因为内存布局更快。因此，我希望将结果移除： array([[ 0, 12], [ 1, 13], [ 2, 14]]) 我该怎么做？我希望nu

浏览 2提问于2014-12-28得票数 1

回答已采纳

2回答

用于快速访问的索引兆行方阵

python、numpy、matrix、blaze

我有一些非常大的矩阵(不包括百万行的顺序)，这些矩阵是无法保存在内存中的，我需要在下降时间内访问这个矩阵的子样本(不到一分钟.)。我开始盯着hdf5和blaze，和numpy和熊猫在一起：但我觉得有点复杂，我不知道这是否是最好的解决办法。还有其他解决办法吗？谢谢编辑这里有一些关于我正在处理的数据类型的更多规范。矩阵通常是稀疏的(< 10%或< 25%的非零单元)。矩阵是对称的。我需要做的是：仅用于阅读的访问提取矩形子矩阵(大部分沿对角线，但也在外部)

浏览 2提问于2016-02-22得票数 4

1回答

用于大数据的数组

python、numpy、matrix、large-data

我需要形成一个总大小为2,886 X 2,003,817的2D矩阵。我尝试使用numpy.zeros创建一个2D零元素矩阵，然后计算并分配矩阵的每个元素(它们中的大多数是零子，我需要替换其中的一些)。但是当我尝试numpy.zero初始化我的矩阵时，我得到了以下内存错误： C=numpy.zeros((2886,2003817)) "MemoryError" 我还尝试在不初始化的情况下形成矩阵。基本上，我在算法的每次迭代中计算每一行的元素，然后 C=numpy.concatenate((C,[A]),axis=0) 其中C是我的最终矩阵，A是当前迭代的计算行。但是我发现这种

浏览 1提问于2014-03-31得票数 1

4回答

python -在字典中找到一个矩阵

python-2.7、numpy、dictionary、matrix

我有一个字典g，它的条目是numpy矩阵。 import numpy as np h = np.array(([1,2],[3,4])) g = {} g[0] = np.array(([1,2,3],[3,4,5])) g[1] = np.array(([11,22],[3,4])) g[2] = np.array(([1,2],[3,4])) g[3] = np.array(([0,2],[3,0])) 我想检查一下h是否在字典g中。在这种情况下，是的，因为g[2]正是h。有没有办法在字典里找一个矩阵？

浏览 8提问于2017-03-27得票数 1

回答已采纳

3回答

将用-v7.3 (HDF5)保存的Matlab稀疏矩阵加载到Python中并对其进行操作

python、matlab、sparse-matrix、hdf5、sparse-array

我是来自matlab的python新手。我有一个很大的稀疏矩阵保存为matlab v7.3 (HDF5)格式。到目前为止，我已经找到了两种在文件中加载的方法，使用h5py和tables。然而，无论在哪一种情况下，对矩阵的操作似乎都非常慢。例如，在matlab中： >> whos Name Size Bytes Class Attributes M 11337x133338 77124408 double sparse >> tic, s

浏览 2提问于2011-12-07得票数 5

回答已采纳

1回答

python to EXCEL单元格范围(NumPy?)

python、excel、numpy

我正在尝试将NumPy准备的矩阵写入EXCEL文件。我需要指定必须在其中写入矩阵的单元格的范围。我需要在EXCEL文件的第4页中将矩阵写入单元格A4:Z 512。现在，标准的EXCEL文件有3张，所以我首先需要添加第4页，然后将矩阵写入其中。有没有办法在python2.7中做到这一点？是否可以使用纯NumPy进行此操作？

浏览 4提问于2014-09-22得票数 0

回答已采纳

2回答

索引共享numpy中的行数据

python、arrays、numpy

我正在使用一个相当密集的numpy数组(例如20-50%)，但具有相同值的较大区域。例如，我可能有一个类似如下的数组： [[0 0 0 0] [1 2 3 4] [0 0 0 0] [3 4 5 6]] 与其将填充了相同值的行(第0行)作为单独的行存储在内存中，是否有一种方法可以共享行内存，从而使行0和行2都访问相同的内存？我正在寻找一些东西，要么是内置于numpy中的，要么是允许普通numpy函数与这样的数组一起工作的。我需要让它看起来像是我仍在使用numpy数组。以下是一些注意事项：我知道我可以在python中创建一个对象，它只是将输入索引映射到一些numpy数组中的数据索引，但

浏览 2提问于2018-05-14得票数 0

1回答

如何分析稀疏邻接矩阵？

math、matrix、data-mining、analysis、polynomials

我正在研究稀疏邻接矩阵，其中大多数单元是0，也有一些是1，两个单元之间的每个关系都有一个多项式描述，这可能非常长，并且它们的手动分析非常耗时。我的老师建议使用的纯代数方法，但在继续之前，我想从纯计算机科学和编程的角度了解如何分析稀疏邻接矩阵？有没有一些数据挖掘工具来分析它们？

浏览 1提问于2015-07-31得票数 6

1回答

稀疏矩阵是如何影响内存使用的？

python、matrix、sparse-matrix

在下面的示例中，我创建了一个带有零的大numpy对象，在对角线上放置一个随机数，然后转换为scipy稀疏矩阵。我对内存使用情况的报告来自任务管理器。 >>> import sys, random >>> import numpy as np >>> from scipy import sparse ## Memory in use at this point: 3.1 Gb >>> m = np.zeros(shape = (40000, 40000), dtype = float) >>> sys.ge

浏览 1提问于2017-05-15得票数 0

回答已采纳

1回答

大型数据集的HDBSCAN处理

python、cluster-analysis、hdbscan

我正在尝试使用HDBSCAN算法在一个由146,000个观测数据组成的大型数据集上实现一个集群。当我用(默认的)Minkowski/欧几里得距离度量对这些观测数据进行聚类时，整个数据的聚类效果很好，只需8秒。但是，我试图用自己的度量来执行集群。当对数据的子集进行操作时，这很好，尽管速度要慢得多。但是，当试图在完整数据集上实现它时，我会立即得到一个内存错误。这是有意义的，考虑到数据集的大小，成对距离矩阵将占用大约150 up。然而，这让我想知道如何使用默认的度量没有这样的问题，同时查看HDBSCAN源代码显示，在这种情况下也调用Sklearn的配对距离，这将返回整个矩阵。此外，我想知道我的度量是

浏览 8提问于2021-11-29得票数 2

回答已采纳

1回答

在不减少存储元素的情况下减去csr矩阵

python、scipy、sparse-matrix

我正在处理减去稀疏矩阵的问题。不幸的是，如果一些单元格在减去后等于0-它就消失了。我所期望的是它存储在元素中，但是值为零。一些过于简单的例子： import scipy.sparse as sparse import numpy as np row = np.array([0, 1]) col = np.array([0, 1]) data = np.array([1 ,1]) sample_csr=sparse.csr_matrix((data, (row, col))) display(sample_csr-sample_csr) # what I have display(samp

浏览 5提问于2020-04-24得票数 0

1回答

矩阵需要有多稀疏才值得表示为稀疏矩阵？

r、memory、matrix、sparse-matrix

在R中，我正在尝试处理一个大的矩阵(39,146,166行x 127列)，并且我在它的一些操作上遇到了内存问题。我已经确定矩阵中大约35%的条目是非零的，其余的都是零。这是否足够稀疏，以至于我可以节省一些内存，使用R的稀疏矩阵类来表示这个矩阵？什么是确定矩阵何时值得稀疏表示的好的经验法则？

浏览 0提问于2016-04-05得票数 6

2回答

压缩一维numpy阵列到二维Hamming距离矩阵

python、arrays、numpy、matrix、scipy

我正在寻找一种可靠的方式来转换一个凝聚汉明距离阵列与scipy.spatial.distance.pdist函数生成的对应的2D汉明距离矩阵。我知道scipy.spatial.distance.squareform函数。然而，我正在计算高达10万x 100,000矩阵的Hamming距离，这就产生了一个MemoryError。我正在寻找一种方法，将压缩矩阵转换成它的方形形式，在逐行的基础上。有人知道使用NumPy和/或相关包的可靠(可能是快速)实现吗？我需要对每一行执行numpy.sum计算，但不能在内存中存储完整的N矩阵。目前，我正在使用嵌套循环来迭代输入矩阵，并“手动”计算距离。 i

浏览 7提问于2016-12-10得票数 3

回答已采纳

1回答

Python:如何使用函数通过理解来定义2D数组？

python

我想要定义一个2D (numpy)数组，以便单元格(行，行) == row+col (或这两个变量的任何其他函数:行和列) 我正在寻找一种函数解决方案，我希望它不会使用任何内存，并且得到的构造可以传递给任何标准的数组操作函数(矩阵mult.) 在C++中可以用模板元编程完成的事情。

浏览 1提问于2012-10-14得票数 2

回答已采纳

2回答

生成随机数组，其中每个条目只能属于一个离散的值集。

python、numpy、scipy

我想要生成一个随机矩阵，形状(20, 30, 3)。每个条目只能是255或0。如何用numpy生成这类矩阵

浏览 4提问于2017-10-15得票数 2

回答已采纳

1回答

将Breeze矩阵转换为Numpy数组

numpy、apache-spark、pyspark、breeze、scala-breeze

可以使用spark将微风密集矩阵转换为numpy数组吗？我这里有一个微风密集的矩阵，我想要转换成numpy数组。

浏览 1提问于2016-12-12得票数 0

2回答

50Kx50K稀疏矩阵

numpy、scipy、sparse-matrix

我需要一个50,000×50,000稀疏矩阵/2d阵列，其中约5%的单元，均匀分布，非空的。我需要：编辑--我需要在numpy/scipy中这样做，如果不清楚的话，很抱歉。此外，增加了要求。从DB读取5%的非空数据，并尽快将其分配给矩阵/2d数组单元格。尽可能少地使用内存。使用花式索引(例如，取列中的索引和所有非空值)。这是美好的拥有，记忆和构造时间作为更重要的。一旦建立了矩阵，矩阵就不会改变。然而，我想要它的转置，最好是O(1)内存和时间。实现这一目标的最有效方法是什么？我能保持nan的值而不是零来表示“空”单元格吗？(0是我的有效值)，我能有效地运

浏览 3提问于2012-12-07得票数 2

回答已采纳

6回答

计算矩阵中大于某个值的所有值

python、arrays、coding-style、numpy、pixel

我必须计算矩阵(二维数组)中大于200的所有值。我为此写下的代码是： za=0 p31 = numpy.asarray(o31) for i in range(o31.size[0]): for j in range(o32.size[1]): if p31[i,j]<200: za=za+1 print za o31是一个图像，我将它转换成一个矩阵，然后找到值。我的问题是，有没有更简单的方法来做到这一点？

浏览 2提问于2012-10-21得票数 87

回答已采纳

4回答

Matlab相当于Numpy广播？

python、matlab、numpy、array-broadcasting

我正在尝试在Matlab中从一个3*(一个大数字)矩阵的每一列中减去一个大小为3的向量。当然，我可以使用循环，但我正在尝试寻找更有效的解决方案，有点像numpy广播。哦，我不能使用repmat，因为我没有足够的内存来使用它(因为它又创建了一个3*(一个大数字)矩阵)…… 这个是可能的吗？

浏览 0提问于2010-07-09得票数 23

回答已采纳

1回答

从一维NaN数组创建NumPy填充元素的滑动窗口

performance、numpy、scipy、time-series、vectorization

我有一个时间序列x[0], x[1], ... x[n-1]，存储为一维numpy数组。我想将其转换为以下矩阵： NaN, ... , NaN , x[0] NaN, ... , x[0], x[1] . . NaN, x[0], ... , x[n-3],x[n-2] x[0], x[1], ... , x[n-2],x[n-1] 我想用这个矩阵来加速时间序列的计算。在numpy或scipy中是否有这样的函数？(我不想用python中的for循环来完成它)

浏览 1提问于2016-11-18得票数 3

回答已采纳

1回答

将元组列表解压到numpy数组中

python、numpy

考虑一个元组列表，例如： a = [(1,2), (3,4)] 我经常发现自己尝试将列表解压到每个列值的单独列表中，例如： b,c = list(zip(*a)) 在本例中，b将是一个包含值1和3的列表。我经常发现我自己希望b和c是numpy数组而不是列表。在这种情况下，我通常做的是： b,c = list(zip(*a)) b = np.array(b) c = np.array(c) 最后两行看起来很麻烦。有没有办法将一个列表直接解压缩到两个numpy数组中，而不是直接通过numpy.array转换它们谢谢

浏览 17提问于2021-11-03得票数 2

回答已采纳

3回答

在输出单元数组中每个元素的平均值时遇到问题(MATLAB)

matlab

我有一个名为magV的1x28单元数组，每个元素包含一个246x247矩阵，其中大部分是NaN。我正在尝试建立一个for循环来遍历每个矩阵并计算平均值。到目前为止的尝试： mean_speeds = cell(1,28); for x = 1 : 28 mean_speeds{x} = mean(magV{x}); end 这不起作用；它只输出另一个1x28单元格数组，每个元素包含1x28行NaNs 我做错了什么？

浏览 1提问于2015-08-08得票数 0

3回答

使用numpy缩小矩阵的大小

python、matrix、numpy

我必须创建一个用户和电视节目的邻接列表，其中行是用户，电视节目是列。如果用户关注那个电视节目，那么矩阵中就会有1，否则是零。这是我从twitter上收集到的信息。总共有140个电视节目和大约530000的独特用户。我使用以下代码生成矩阵，使用python： NoTvShows:电视节目总数(ID) unique_user:所有唯一的用户 collected_users:这是一个列表。子列表对应于电视节目，并列出追随者的ID。 for i in range(0,NoTvShows): for every_user in unique_users: if

浏览 6提问于2012-04-27得票数 1