这是我写的代码:void matrix_multi(int c[][TSIZE], int a[][TSIZE], int b[][TSIZE]) intsum+=a[i1][k1]*b[k1][j1]; c[i1][j1]+=sum;我的问题是:通过对三个内部循环进行一些进一步的操作,我可以获得更好的性能吗?
我面临着一个问题,我需要在两个大矩阵A [400000 x 70000]和B [70000 x 1000]之间执行矩阵乘法。这两个矩阵是密集的,并且没有我可以利用的特殊结构。读取矩阵需要大约500秒,计算大约需要300秒。
在这里使用PyTables是否有助于提高I/O效率?有没有可以帮助提高时间效率的库?[400000 x 70000],betas的大小为[70000 x 1000]。这里的geno是一个存储在磁盘中<em