腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
为什么
我
的
OpenMP
程序
不能
随着
线程
数量
的
增加
而
扩展
?
、
、
、
我
编写了一个
程序
来计算1M个数组
的
和,其中所有元素= 1。
我
使用
OpenMP
进行多
线程
处理。但是,运行时并不随
线程
的
数量
而
扩展
。< endl; cout << sum << endl; } 不同N_TH
浏览 56
提问于2021-10-22
得票数 0
1
回答
OpenMP
运行时间
、
我
正在使用
OpenMP
运行一些并行工作,但发现加速
不能
很好地
扩展
。然后
我
发现,
随着
线程
数量
的
增加
,执行相同
数量
的
工作所需
的
时间也会
增加
。double end = omp_get_wtime(); return 0;
浏览 2
提问于2014-12-13
得票数 2
1
回答
元素矩阵乘法
的
并行化
、
、
我
目前正在优化代码
的
部分,因此执行一些基准测试。!$OMP END PARALLEL DO现在发生
的
奇怪
的
事情是,不管
线程
数量
(在1到4之间),执行时间或多或少保持不变(+- 10%),但是CPU时间却
随着
线程
数量
浏览 5
提问于2013-07-23
得票数 5
回答已采纳
2
回答
用C语言实现
OpenMP
的
基准测试
、
、
我
正在寻找一个C语言
的
OpenMP
基准测试,只是一个简单
的
(无用
的
)任务,证明这项技术真的有效。
浏览 2
提问于2013-11-17
得票数 0
1
回答
为什么
我
的
程序
的
性能会
随着
线程
数量
的
增加
而
下降?
、
、
我
正在学习多
线程
编程。
我
写了一个简单
的
程序
,但是
我
的
程序
的
性能
随着
线程
数量
的
增加
而
下降。
我
想在所有
线程
完成thread_local_init()之后测量
我
的
程序
,所以我使用flag来同步。但是
随着
线程
<e
浏览 3
提问于2021-02-02
得票数 0
1
回答
为什么
我
的
多
线程
示例中
的
时间
随着
线程
数量
的
增加
而
增加
、
、
、
如何编写多
线程
windows应用
程序
,在给定
的
线程
数中运行
程序
,并显示每个
线程
所用时间
的
结果。
我
试图创建它,但我可以看到我
的
程序
显示不正确
的
结果,这意味着当我
增加
线程
的
数量
时,每个
线程
所花费
的
时间也会
增加
(如消息框所示)。当它为2时,两个
线程
各自花费
浏览 0
提问于2012-06-18
得票数 0
回答已采纳
1
回答
如何测量Linux中
OpenMP
代码
的
内存使用率?
、
、
、
如何测量
OpenMP
代码
的
内存使用情况?
我
相信,内存使用量会
随着
线程
数
的
增加
而
减少。
我
使用
的
是Linux和英特尔Fortran编译器。
浏览 0
提问于2017-04-26
得票数 0
2
回答
OpenMP
与矢量化
的
比较
、
给定一个示例函数(下面给出示例),for循环可以使用
OpenMP
并行化,也可以使用向量化(假设编译器执行向量化)进行向量化。float* c, int n) for(int i = 0; i < n; i++) c[i] = a[i] * b[i];}注意:
我
没有给出关于SSE
的
不同版本,处理器/核
的
数量
(
随着
<em
浏览 3
提问于2012-05-09
得票数 2
回答已采纳
1
回答
随着
线程
数量
的
增加
,
OpenMP
实现变得越来越慢
、
我
一直在努力学习如何使用
OpenMP
。然而,
我
的
代码似乎在串行和并行中运行得更快。为了说明这一点,
我
做了一个实验。,并将运行时间作为内部循环迭代次数(N)和使用
的
线程
数量
的
函数进行了比较。这个实验
的
代码如下。<< " " << parallel[i][j]<< std::endl;
浏览 0
提问于2017-11-08
得票数 1
1
回答
OpenMp
:如何确保每个
线程
在动态调度中至少执行一次迭代
、
我
使用循环迭代
的
动态调度。但是,当每次迭代中
的
工作太小时,一些
线程
就
不能
工作,或者当有大量
线程
时。例如:有100个迭代和90个
线程
,
我
希望每个
线程
至少执行一次迭代,剩下
的
10个迭代可以分发给已经完成任务
的
线程
。
我
怎么能这么做?
浏览 1
提问于2020-02-29
得票数 0
回答已采纳
1
回答
OpenMP
线程
创建
、
、
、
、
在下面的代码中,
OpenMP
运行时将重新创建
线程
还是重用以前创建
的
线程
-即使用
线程
池?一些同事认为,它会重新创建
线程
,因为“#并行”子句嵌套在for中;
我
对此表示怀疑,并对GDB进行了一些测试,这表明这不是事实。
线程
实际上是重用
的
。
浏览 0
提问于2017-07-24
得票数 1
1
回答
如何设计从Kafka获取客户端事件
的
API?
、
、
、
当我
的
服务
的
每个客户端都有自己
的
kafka使用者时,我会考虑架构模式。每个客户端都有自己
的
offset。所以我
的
应用
程序
接口允许使用offset来获取客户端事件。 它
的
系统设计很好吗?或者,什么是正确
的
API设计来获取事件?
浏览 0
提问于2019-03-01
得票数 0
1
回答
从
openmp
循环调用顺序英特尔mkl
、
、
由于zaxpy使用
的
“向量”不是那么大,
我
尝试使用
openmp
来加速
程序
。
我
用英特尔
的
vtune工具检查了运行时间(这就是debug all标志
的
原因)。
我
有一个i5 4430,这意味着4个
线程
和4个物理核心。 使用
openmp
的
时间: 107s;不使用
openmp
的
时间: 44s 有趣
的
是,
随着
线程
数
浏览 18
提问于2020-04-01
得票数 1
2
回答
循环内部
的
OpenMP
并行化花费太长时间。
、
我
正在准备一个必须使用
OpenMP
并行化
的
程序
。
程序
应该比较两个帧,其中两个帧必须一个块地进行比较,
而
OpenMP
必须以两种方式应用:一种是帧工作必须在
线程
之间分割,另一种是必须在
线程
之间通过块级来划分工作,找到每个比较
的
最小成本。这是可行
的
,并且
随着
使用
的
线程
数量
的
增加
,
程序</em
浏览 5
提问于2020-08-03
得票数 0
回答已采纳
1
回答
openMP
的
并行化效率
、
、
、
我
有一个C++代码,其中包含在8
线程
计算机上与
openMP
并行
的
多个for-循环.无论如何,<e
浏览 2
提问于2012-06-26
得票数 0
回答已采纳
1
回答
用于循环
的
两个omp之间
的
差异
、
、
我
刚刚开始使用
OpenMP
,并且正在编写一个函数,该函数将数组划分为numBlocks块,并通过检查每个块
的
blockSize元素(在
我
提供
的
代码中,直方图是记录块中元素
的
可分性由整数1到numBuckets++){ // Compute histogram here by examining array[idx]如果
我
将
线程
数
浏览 0
提问于2013-04-15
得票数 1
回答已采纳
1
回答
正确使用
openMP
目标构造
、
我
正在尝试弄清楚
我
是否正确地使用了
Openmp
4结构。loop1{} loop2{} } }
我
的
整体代码正在工作,并且
随着
线程
的
增加
而
变得更快,但我想知道代码是否在目标设备(Xeon phi)上正确执行。此外,如果
我
删除所有omp内容并按顺
浏览 2
提问于2014-06-24
得票数 0
1
回答
基于ARM皮层A9双核(Linux或VxWorks)
的
多
线程
、
、
、
我
正在研究双核(尤其是在嵌入式系统中)是如何有益
的
。
我
想比较两个目标:一个是手臂皮质-A9 (925 MHz)双核,另一个是臂皮质-A8单核。
我
有一些想法(请看下面),但我不确定,我会使用双核功能:如何在不同
的
核心上执行多个
线程
(没有
OpenMP
,因为它
不能
在
我
的
目标上工作,而且它与VxWorks3-是否可以添加C标志以指示CPU核
的
数量</em
浏览 3
提问于2017-06-16
得票数 0
1
回答
为什么
卡桑德拉要创造很多
线程
?
我
有3000个IOT设备,每10秒向卡桑德拉发送数据。早些时候,卡桑德拉服务每天都会被退出(失败)。因此,我们将服务器
增加
到62 Gb RAM和10 to硬盘。
我
注意到taht cassandra已经创建了140个
线程
。请找出自动屏幕截图。 📷
浏览 0
提问于2022-11-30
得票数 0
3
回答
增加
xcode上
的
线程
数会
增加
程序
时间。
、
、
我
是
openmp
的
新手,目前正尝试在mac上并行xcode中
的
矩阵乘法。omp_set_num_threads(4); #pragma omp paral
浏览 2
提问于2019-03-06
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
优化串行处理代码,获取OpenVPX数字信号处理模块最佳性能,拓展串行算法在计算密集型领域应用
基于深度神经网络的点云孔洞修补算法的并行化研究
什么是python的全局解释锁?
测试人员必须要了解内容之压力测试中存在的问题
软件测试人员最常用的压力测试,但是你不知道的压测问题
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券