从基因表达数据(40000个基因(变量)x 30个观察值)中,我想创建一个40000 x 40000协方差矩阵。这绝对比我的内存大。使用包'ff‘,我设法为相关性预先分配了一个40000x40000的空矩阵。然而,'cov‘或'cor’函数在我的系统上只能管理一个5000x5000的协方差矩阵,所以我必须按块进行1:5000,5001:10000等协方差计算,并沿着对角线填充预先分配的矩阵。有谁知道一种算法来填补矩阵中的“缺失补丁”,即协方差(或相关性)1和22000。我知道我可以做所有的成对组合,并逐个填充矩阵,但'cor‘相当快……那么,有没有一种方法可以使
我有一个很大的n*m矩阵S。我想有效地确定在F中是否存在子矩阵S。大矩阵S的大小可以和500*500一样大。
为澄清这一问题,请考虑以下几点:
S = 1 2 3
4 5 6
7 8 9
F1 = 2 3
5 6
F2 = 1 2
4 6
在这种情况下:
F1在S里面
F2不在S里面
矩阵中的每个元素都是32-bit整数。我只能用蛮力的方法来找出F是否是S的子矩阵。我在谷歌上搜索了一种有效的算法,但什么也找不到。
是否有更快的算法或原则呢?(或者可能是某种优化蛮力方法的方法?)
PS统计数据
A total of 8 S
On av
我有一个矩阵m
set.seed(1)
m = matrix(rnorm(100), nrow = 10, ncol = 10) # my data is not a random matrix in reality, but it should not matter
我想在矩阵的每一行中添加5%的Gaussian噪声。矩阵行中的每一个元素都应该得到不同的随机噪声。随机值应根据每一行的sd按行顺序计算.
到目前为止,我已经用一个for loop实现了它,它似乎完成了以下工作:
for (i in 1:nrow(m)){
m[i, ] = m[i, ] + rnorm(n = n
Google Maps API中的距离矩阵请求限制为25个目的地。我希望能够使用geolocation获得我的当前位置,并根据我汇编的火车站地址数据库找到最近的火车站。我的问题是我的数据库可能包含100+火车站,所以我需要将一个大距离矩阵请求拆分成多个小距离矩阵请求。当Google Maps API返回结果时,它会规范化地址的格式,这使得以编程方式将响应与基于地址字符串的原始数据库行配对变得困难。此外,这些是异步请求,这意味着响应可以以任何顺序出现。有没有什么方法可以将索引传递给回调函数,这样我就可以将响应与请求配对?处理这个问题的最好方法是什么?
我想在矩阵X上定义一些函数。例如,mean(pow(X - X0, 2)),其中X0是另一个矩阵(X0是固定/常数)。为了更具体地说明,让我们假设X和X0都是10 x 10矩阵。操作的结果是一个实数。
现在我有了一个大矩阵(比方说500 x 500)。我想将上面定义的操作应用于“大”矩阵的所有10 x 10子矩阵。换句话说,我想将10 x 10窗口滑过“大”矩阵。每个窗口的位置,我应该得到一个真实的数字。因此,作为最后的结果,我需要得到一个实值矩阵(或2D张量)(它的形状应该是491 x 491)。
我想要的是接近卷积层,但不是完全相同的,因为我想使用均方偏差,而不是用神经元表示的线性函数。
我正在用Julia编写代码,这涉及到将一个大的整数矩阵提高到一个很高的幂,我想让这个代码更高效。我一直在JuliaLang上搜索,但我不确定当我把矩阵提升到朱莉娅的幂时,朱莉娅是否会自动使用最快的方法(二进制指数或类似的方法),或者它是否会依次乘以矩阵,例如A^p = A* A *A,我能通过手动实现二进制幂来加速我的代码吗,还是朱莉娅已经为我做了这件事?