腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
CUBLAS
转
置
矩阵
乘法
问题
、
、
、
我正在尝试在
CUBLAS
中倍增C = At * B。
问题
是,在我的代码中(取自 ),在一些
矩阵
维度中,它似乎工作得很好,int rows_a = 1, cols_a = 200, rows_b = 1, cols_b = 200。在我的代码中,我设置了两个
矩阵
,然后用
CUBLAS
函数cublasSgemm做
乘法
,之后,我用一些CPU函数做同样的
矩阵
乘法
,以检查它是否正常。rows_b * cols_b * sizeof(float)); flo
浏览 12
提问于2019-11-14
得票数 0
回答已采纳
1
回答
利用
cuBlas
实现
转
置
矩阵
的高效
乘法
、
、
当一个大的稠密
矩阵
与它的
转
置
相乘时,是否有一种有效的使用
cuBlas
的方法?具体而言,是否有任何函数利用结果
矩阵
是对称的这一事实,从而将
乘法
次数减少到~2的倍数。
浏览 3
提问于2016-04-22
得票数 0
回答已采纳
1
回答
如何使用blas以最佳方式
转
置
矩阵
?
、
、
、
然而,我遇到了一个
问题
。 我正在测试
cuBlas
,在图形处理器上做linAlg看起来是个好主意,但有一个
问题
。使用列主格式的
cuBlas
实现,由于这不是我最终需要的,我很好奇是否有一种方法可以让BLAS进行
矩阵
转
置
?
浏览 1
提问于2011-10-16
得票数 10
回答已采纳
1
回答
CUBLAS
矩阵
加法..多么?
、
、
、
、
我正在尝试使用
CUBLAS
对两个大的未知大小的
矩阵
求和。我需要一个完全优化的代码(如果可能),所以我选择不重写
矩阵
加法代码(简单),而是使用
CUBLAS
,特别是允许对A和C求和的cublasSgemm函数(如果B是单位
矩阵
):*C =α*op(A)*op(B)+β*c*
问题
是:C和fortran以行为主的格式存储
矩阵
,cublasSgemm旨在(为了与C++兼容)以列为主的格式工作。您可以指定是否先
转
置
A和B,但不能指定
转<
浏览 1
提问于2011-03-26
得票数 3
回答已采纳
1
回答
用CUDA计算(A (D^-1)B^T )^-1
、
、
、
、
(A (D^-1)B^T )^-1 其中,D是一个很大的对称
矩阵
,A是一个小对称
矩阵
,使得B和B^T中等大小的矩形非对称
矩阵
。当然,(^-1)和(^T)分别是逆运算和
转
置
运算。
浏览 4
提问于2013-08-17
得票数 0
1
回答
cuBLAS
howto中的
转
置
矩阵
乘法
、
、
、
、
问题
很简单:我有两个
矩阵
,A和B,它们是M乘以N,其中M >> N。我想首先取A的
转
置
,然后乘以B (A^T * B),将其乘以C,即N乘以N。我知道
cuBlas
有一个cublasOperation_t枚举,用于预先
转
置
内容,但不知何故,我没有完全正确地使用它。我的
矩阵
A和B是以行为主的顺序,即row1 row3 .....在设备内存中。这意味着A要被解释为A-
转
置
,BLAS需要知道我的A是以列为主的顺序
浏览 1
提问于2013-01-30
得票数 4
1
回答
计算
矩阵
乘以其
转
置
的有效算法
、
、
、
对于一堂课,老师提出的一个
问题
是
矩阵
乘以
转
置
的算法成本。用标准的3环
矩阵
乘法
算法,效率为O(N^3),我想知道是否有一种方法来操纵或利用
矩阵
*
矩阵
转
置
,从而得到一个更快的算法。我知道,当你把一个
矩阵
乘以它的
转
置
时,由于它是对称的,你必须计算它的较少,但我想不出如何操作一个小于O(n^3)的算法。我知道像Coppensmith和Straussen这样的算法是更快的一
浏览 4
提问于2011-09-28
得票数 10
1
回答
CUBLAS
通用
矩阵
点积
、
、
、
我编写了一个struct和一些包装"
CUBLAS
矩阵
对象“的函数。typedef struct { uint cols;} matrix;matrixmatrix_free(matrix* w) cudaFree(w->devPtrvals); return 1;函数,该函数从浮点数数组中设置
矩阵
的值return 1;我有一个<e
浏览 4
提问于2013-10-23
得票数 1
回答已采纳
1
回答
二维
转
置
卷积可以表示为Toeplitz
矩阵
乘法
吗?
、
、
、
、
二维
转
置
卷积运算是否可以表示为与Toeplitz
矩阵
的
矩阵
乘法
,就像普通卷积一样? 我想将一些想法从密集网络推广到卷积网络。对于正常的卷积,这不是
问题
,因为它们可以表示为与Toeplitz
矩阵
的
矩阵
乘法
。但我找不到
转
置
卷积的清晰数学公式,所以我不确定这种情况。
浏览 26
提问于2019-07-04
得票数 1
1
回答
一种利用转座子加速cuSPARSE稀疏密乘的方法
、
、
、
我使用垫子解析和
cublas
计算一个稀疏密
乘法
:C=A‘* B。A是M*N稀疏
矩阵
M= 9,633,792,N= 617,004,nnz为28,901,376,S=3 A‘= At以CSR格式存储,使用cusparseScsrmm2计算At *( B’)‘,
转
置
B以改善
矩阵
B的内存访问,根据文档,如果op(B) = B^T,只支
浏览 3
提问于2016-07-03
得票数 2
4
回答
如何在CUDA/
cublas
中转
置
矩阵
?
、
、
、
、
假设我在图形处理器上有一个维度为A*B的
矩阵
,其中B (列数)是假设C样式的领先维度。在CUDA (或
cublas
)中有没有什么方法可以将这个
矩阵
转
置
到FORTRAN风格,其中A (行数)成为前导维度?如果在host->device传输过程中可以在保持原始数据不变的情况下进行
转
置
,那就更好了。
浏览 1
提问于2012-12-09
得票数 5
回答已采纳
1
回答
利用CUDA指针反演库达
矩阵
、
、
目前,我只是尝试在基于
cuBLAS
的简单线性回归算法的基础上与数据自动化系统实现。
矩阵
乘法
和
转
位与cublasSgemm函数很好地结合。
问题
从基于
cublas
<t>getrfBatched()和
cublas
<t>getriBatched()函数的
矩阵
反转开始(参见)。 可以看到,输入这些函数的参数--指向
矩阵
的指针数组。想象一下,由于先前的计算,我已经为GPU上的(A^T * A)
矩阵
分配了内
浏览 1
提问于2015-08-21
得票数 1
回答已采纳
3
回答
在CUDA中转
置
矩阵
的最有效方法是什么?
、
我有一个M*N主机内存
矩阵
,在复制到设备内存中时,我需要将其
转
置
为N*M
矩阵
。有没有什么cuda (
cuBLAS
...)API会这么做吗?我正在使用CUDA 4。谢谢!
浏览 0
提问于2013-03-17
得票数 3
回答已采纳
1
回答
如何避免
矩阵
本身对
矩阵
乘法
的奇异性
、
我用Mathematica编写了下一个代码,以求
矩阵
本身
转
置
矩阵
的
乘法
逆:B = A\[Transpose].A;F // MatrixForm 它总是告诉我,
矩阵
(B)是奇异的,-despite (A)是随机的,而
矩阵
的
转
置
乘法
是可以的!RandomInteger[{1, 20}, {3
浏览 16
提问于2021-10-31
得票数 1
回答已采纳
3
回答
用它的
转
置
来乘一个大而稀疏的
矩阵
的最佳方法是什么?
、
、
、
、
我现在想用它的
转
置
来乘一个大型稀疏
矩阵
(~1M×200 k)。结果
矩阵
的值将以浮点数表示。
矩阵
的
乘法
及其
转
置
。因此,得到的
矩阵
是
浏览 7
提问于2014-07-04
得票数 10
回答已采纳
2
回答
在CUDA上测量有效带宽
、
、
所以我想知道如何计算总内存有效带宽:其中该函数适用于
cublas
_v2.h 该函数的运行时间为
浏览 0
提问于2013-02-19
得票数 1
回答已采纳
2
回答
两个下三角
矩阵
乘法
的复杂性
、
、
我知道两个全
矩阵
乘法
的下界是Ω(n^2)。我最初的想法是:(1)对下三角
矩阵
进行变换,(2)估计这种变换的时间复杂度。full_matrix_multiplication(n)) = Ω(n^2) 现在,我只需要证明O(lower_triangular_matrix_transformation(n)),我需要使三角
矩阵
成为一个完整的
矩阵
,所以为了简单起见,我让这个三角
矩阵
乘以
浏览 2
提问于2016-03-11
得票数 11
1
回答
使用这个命令`np.linalg.eig(H*H)`来计算特征分解是否合适?
、
、
我正在学习这个post和这个post。 我试图用Python,NumPy将计算结果重现为这个post。 H = np.array([[0.1, 0.3, .4],[0.5 , 0.5, 0.9],[0.1, 0.4, 0.5]])w, v = np.linalg.eig(H*H) 与此post相比,np.linalg.eig(H*H)给出的结果截然不同。 为什么会这样呢?
浏览 40
提问于2019-06-24
得票数 3
1
回答
用本征乘积X*X.transpose()的最快方法?
、
、
我想要多个自转
置
矩阵
。关于X8,100的
矩阵
的大小。现在它看起来是“MatrixXf h= X*X.transpose()” ( c)有关该等
矩阵
的快速
乘法
的任何提示。
浏览 4
提问于2014-07-31
得票数 1
回答已采纳
1
回答
Java箭头转换- Box2d
、
、
我想做的就是当箭头撞上一个盒子时,我找到了一个教程,但它是在C++中,我找不到解决这个
问题
的方法。实际上这是一道数学题。
问题
是Java中没有b2MulT或b2Mul函数。当碰撞发生时,我想用旧箭头的值的位置和角度来转换箭头。
浏览 0
提问于2014-06-29
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
人工智能AI(5):线性代数之矩阵、线性空间
Python模块-Numpy(三)-数值运算
机器学习中的线性代数入门
这是一份文科生都能看懂的线性代数简介
从机器学习学python(四)——numpy矩阵基础
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券