腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
OpenMP
矩阵
乘法
问题
、
、
、
我正在尝试将
矩阵
的值相乘。我的逻辑是将
矩阵
从第一个4语句分成4个部分。我相信这是符合逻辑的。 在我完成这部分之后。我想弄清楚如何更多地为并行加速这个过程。可能使用的是Strassen
矩阵
乘法
。我已经花了大约5个小时来尝试解决这个
问题
。
浏览 10
提问于2021-07-22
得票数 0
回答已采纳
2
回答
使用
openmp
时出现奇怪的速度减慢
、
、
我试图通过并行化
矩阵
乘法
来提高一个相当复杂的迭代算法的性能,每次迭代都会调用
矩阵
乘法
。该算法需要500次迭代和大约10秒。但是在并行化
矩阵
乘法
之后,它会减慢到13秒。然而,当我单独测试相同维数的
矩阵
乘法
时,速度有所提高。(我说的是100x100
矩阵
。)因此,在主算法中使用
openmp
500次调用任何并行化都会以某种方式减慢速度。这种行为在我看来非常奇怪,谁知道
问题
出在哪里? 主算法由Win32版本
浏览 6
提问于2012-07-13
得票数 3
2
回答
稀疏
矩阵
乘法
程序
openmp
、
我正在寻找任何使用
OpenMP
API进行稀疏
矩阵
-向量或
矩阵
-
矩阵
乘法
的标准C程序。有没有人可以告诉我有没有这样的项目。
浏览 3
提问于2011-08-17
得票数 2
1
回答
稀疏
矩阵
乘法
的最佳包
、
、
、
、
我正在寻找最好的包稀疏
矩阵
乘法
上的单核解。我不寻找CUDA,MPI或
OpenMP
解决方案。我必须乘两个大
矩阵
,它们是稀疏格式的。一个
矩阵
是677000乘48000,另一个
矩阵
是48000乘8192.这里,n-by-d表示行的n:#,列的d:#。
浏览 0
提问于2013-08-23
得票数 2
回答已采纳
1
回答
openmp
矩阵
乘法
、
、
、
我试着写一个基于
Openmp
的
矩阵
乘法
代码。
矩阵
mm和
矩阵
mmt的
乘法
是对角
矩阵
,并且等于1。我尝试使用普通计算和
Openmp
。正常的结果是正确的,但是
Openmp
的结果是错误的。我认为它应该是相对于
Openmp
使用率的。$OMP ENDDO endsubroutine 我给出了下面的法线版本,如果你计算这个,结果是对角线1
矩阵
。
浏览 22
提问于2021-08-12
得票数 2
回答已采纳
2
回答
矩阵
乘法
并行实现(
OpenMP
)
、
、
、
我连续运行了一个
矩阵
乘法
代码,而parallelized.There与并行版本相比并没有明显的改进。
浏览 1
提问于2018-03-15
得票数 0
回答已采纳
2
回答
计算高维向量
矩阵
间最小欧氏距离的最快方法
、
、
、
、
我在上开始了类似的
问题
,但后来我把重点放在了如何使用OpenCV上。在没有实现我最初想要的东西之后,我会在这里问我到底想要什么。 } vocIndex=0;} 附件是带有样本
矩阵
的文
浏览 1
提问于2012-09-26
得票数 6
1
回答
csc中spmv的
openmp
并行化
、
、
在稀疏
矩阵
向量
乘法
之后,当
矩阵
是压缩的稀疏列格式时,
OpenMP
如何并行化?ia(i),ia(i+1)-1 y(ind)=y(ind)+x(i)*a(k)end do 这里,ia、ja和a分别是列指针、行索引和
矩阵
的非零值
浏览 1
提问于2013-07-10
得票数 2
回答已采纳
1
回答
openMP
区块和缓存大小
、
、
我有一个执行
矩阵
乘法
的简单Fortran代码,它与
OpenMP
并行化,如下所示使区块大小相对较大,并使区块数量成为处理器数量的倍数(4、8、16等) 然而,当
矩阵
大小变得非常大时,将块大小设置为小于缓存大小似乎更符合逻辑(至少值得一试或者它不被
OpenMP
支持?
浏览 1
提问于2013-06-18
得票数 0
1
回答
初学者
OpenMP
项目构想
、
、
我有一个并行编程项目,我必须在C++和
openMP
中完成,这个项目将在一周内完成,我想知道是否有人能给我一个关于C++和
OpenMP
初学者在这个时候可以完成的事情的想法。
浏览 1
提问于2015-03-09
得票数 1
回答已采纳
1
回答
OpenMP
-在并行代码内部运行并行代码
、
、
我有一个使用
OpenMP
在其中并行化
矩阵
乘法
的函数compute()这个函数在一个循环中被多次调用--我想要并行运行。在其他并行代码中运行并行代码会有什么
问题
吗? 这是在Ubuntu上编译的c++。
浏览 2
提问于2011-09-08
得票数 10
回答已采纳
4
回答
在C++中利用并行处理加速
矩阵
计算?
、
、
、
(Y0*Z) )*dt 计算独立于计算的子
矩阵
A2 = A*Y0和Z2 = Y0*Z,那么Un2 = Un.*A2和Vn2 = Vn.
浏览 4
提问于2011-03-24
得票数 2
回答已采纳
1
回答
Eigen3
矩阵
乘法
性能取决于处理器?
、
、
、
、
在过去的几个月里,我一直在使用计算机
矩阵
乘法
技术,并使用
openMP
和eigen3进行了一些测试。,使用了以下
矩阵
-
矩阵
乘法
算法:{for (j=0;j<N; j+=2)*
矩阵
尺寸分别为2700×2500和2500×2700。*启
浏览 4
提问于2012-12-10
得票数 1
回答已采纳
1
回答
为什么艾根不支持
OpenMP
的系数运算?
、
、
和一些测试表明,特征不适用于系数级运算,如cwiseProduct或Array
乘法
,尽管
矩阵
矩阵
产品可以开发多个核。尽管如此,使用一些优化特征似乎是相当快的,而且即使我试图为特定目的编写自己的
矩阵
库,我也怀疑即使启用了库的
OpenMP
,它是否会比特征库更快。 ,,为什么艾根在系数运算方面不支持
OpenMP
?Can进行多处理,我手动地包括了对此类操作的
OpenMP
支持?特征的代码看起来很复杂,因此很难找到特定函数的确切实现,即使使用Visual instruments.也
浏览 5
提问于2022-04-04
得票数 1
2
回答
OpenMP
-“#语用omp关键”的重要性
、
、
、
、
因此,我开始使用
OpenMP
(多线程)来提高
矩阵
乘法
的速度,我目睹了一些奇怪的事情:当我关闭
OpenMP
Support (在Visual中),嵌套的for-循环完成速度快了2倍。因此,我删除了“#语用omp关键程序”,以测试它是否显著减慢了进程,并且进程比之前快了4倍(使用
OpenMP
Support On)。 我的
问题
是:在嵌套循环中很重要吗?
浏览 3
提问于2021-06-23
得票数 1
回答已采纳
1
回答
如何使用本征源代码编写的稀疏
矩阵
/稠密向量
乘法
并行化?
、
根据本征文献,只要设置了适当的编译标志并定义了OMP_NUM_THREADS=x,所有稀疏
矩阵
/密集向量
乘法
都将并行运行,无论
乘法
发生在何处。我关注的是以下源代码中的第58行和第98行,其中sm/dv
乘法
发生。值得注意的是,下面的代码是本征的不受支持的迭代求解器模块的一部分,但我不认为这个事实会导致并行化的失败。/my_executable我大致记得有人提到,为了利用多个核,稀疏
矩阵
必须充分填充,而不是仅仅是上
浏览 3
提问于2019-10-20
得票数 0
回答已采纳
1
回答
PyTorch方法中使用了哪些类型的优化?
、
、
、
我使用torch.mm或torch.dot等方法,使用PyTorch实现了一系列密集的
矩阵
运算。我想知道PyTorch是否使用了多线程或其他优化机制来加速这个过程。我没有使用GPU。
浏览 20
提问于2019-01-26
得票数 1
回答已采纳
1
回答
如何用
openmp
优化
矩阵
向量
乘法
?
、
、
我已经用C语言创建了一个执行
矩阵
向量
乘法
的程序。我使用
openMP
指令并行执行计算。但是,有没有办法在编译代码时使用
openMP
进一步优化(=更少的执行时间)
矩阵
向量
乘法
,而不使用优化标志?
浏览 46
提问于2020-10-24
得票数 0
7
回答
OpenMP
和Python
、
、
我有为共享内存机器(在C和FORTRAN中)编写
OpenMP
代码以执行
矩阵
加法、
乘法
等简单任务的经验(看看它是如何与LAPACK竞争的)。我对
OpenMP
有足够的了解,可以执行简单的任务,而不需要查看文档。在Python中使用
OpenMP
最简单的方法是什么?最简单的,我指的是在程序员方面花费最少的精力(即使它是以增加系统时间为代价的)?我之所以使用
OpenMP
,是因为
浏览 22
提问于2012-07-06
得票数 82
回答已采纳
1
回答
在
矩阵
乘法
中使用C++2011线程而不是
OpenMP
时注意到的异常加速
、
、
、
我为我的学生写了一个演示代码(
矩阵
乘法
),为了证明即使在使用并行代码时也必须正确使用缓存,我发现使用C++2011线程(通过boost::thread )比使用
OpenMP
(并行for)线程的性能高出演示代码相当长(在正确的、错误的(错误的缓存访问)、标量和
OpenMP
中重复四次无聊的相同
矩阵
初始化和
乘法
),可以在以下位置找到: 标量执行时间: 14.42秒
OpenM
浏览 0
提问于2012-03-11
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
什么是矩阵乘法?详述矩阵乘法的原理?用C语言实现矩阵乘法的算法。内附代码。
数学的力量——稀疏矩阵,所有科学都是矩阵乘法
哈佛、MIT学者联手,创下矩阵乘法运算最快纪录
线性篇-A0:距离与最小二乘法矩阵形式
【行业资讯】人工智能揭示矩阵乘法的新可能性
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券