腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(77)
视频
沙龙
2
回答
如何#ifdef __
builtin_prefetch
函数
、
如何在代码中保留__
builtin_prefetch
(),但使编译器不能成功编译它?(只是在找到它的地方什么都不做)。
浏览 47
提问于2017-03-12
得票数 0
回答已采纳
5
回答
预取示例?
、
、
、
有没有人能给出一个例子或者指向一个例子的链接,这个例子在“GCC”中使用了__
builtin_prefetch
(或者仅仅是asm指令prefetcht0 )来获得显著的性能优势?特别是,我希望这个示例满足以下标准: 这是一个简单、小、自包含的example.Removing degradation.Replacing __
builtin_prefetch
指令会导致性能下降__
builtin_prefetch
指令与相应的内存访问会导致性能下降。也就是说,我想要一个最短的示例,展示__
builtin_prefetch
执行一
浏览 307
提问于2011-09-07
得票数 67
回答已采纳
3
回答
为什么__
builtin_prefetch
在这里没有任何影响?
、
、
、
size_t i = 0; i < size ; ++i ) ptr = ( static_cast<char*>(sentenceMap) + i );} 如您所见,我添加了一条
builtin_prefetch
指令,希望将循环的下一次迭代放入缓存中在c = *ptr行上,当L3未设置时,cachegrind记录632,378
浏览 6
提问于2012-09-19
得票数 7
回答已采纳
2
回答
我应该忽略__
builtin_prefetch
()函数还是替换它?
、
当我将代码从linux移植到win32时,它涉及到__
builtin_prefetch
()函数。谢谢。
浏览 5
提问于2012-03-09
得票数 1
回答已采纳
1
回答
预取到特定级别的缓存
GCC有支持预热的__
builtin_prefetch
。我的问题是如何将数据预取到特定级别的缓存。例如,我只想将数据预取到L2 cache,而不是一直预取到L1 cache。
浏览 0
提问于2011-01-04
得票数 1
回答已采纳
1
回答
预取对齐内存
、
、
、
这种对齐方式将如何与像gcc __
builtin_prefetch
这样的预取指令交互呢?预取的效果是否与使用非对齐数组相同?谢谢。
浏览 1
提问于2011-06-25
得票数 1
回答已采纳
1
回答
预取大量参考数据的实用限制
、
、
、
、
守护进程将其关联设置为套接字上的一个核心,并将定期在引用数据的每64字节的地址上调用__
builtin_prefetch
(),以便为在同一套接字上运行的其他核心上运行的所有进程保留L3缓存中的所有引用数据例如,考虑守护进程中用于将引用数据保存在缓存中的下列伪代码: __
builtin_prefetch
(i + (void*)&referenceData);对于50 of的参考数据,上述循环将快速连续调用__
bu
浏览 1
提问于2019-06-18
得票数 2
2
回答
如何在不等待检索的情况下在C++中获取内存位置?
、
、
、
、
假设我们想从数组中获取一个值。在其他情况下,我们需要通过一些偏移量来移动索引:i += offset[i] // Or if i is very small (data[i] is in the same cache line & page) i += offset_shifts[i]; // LLC cac
浏览 4
提问于2020-06-22
得票数 2
回答已采纳
2
回答
如何在C中预取指向AMD Opteron 6168的指针?
、
、
我正在用C语言编写一个多线程程序,其中一个核心周期性地从链表的头部抓取一个项,而其他核心将项附加到链表的后面(为了线程安全,使用CAS魔法,其他人为我提供了)。看起来我的程序会运行得更快,如果核心从列表的头部获取一个项目,只是启动对下一个项目的预取,而下一个项目肯定在另一个核心的缓存中。我不知道如何找到我想要的东西的引用,或者如
浏览 0
提问于2010-10-14
得票数 0
回答已采纳
1
回答
__
builtin_prefetch
,它读了多少?
、
、
、
、
我正在尝试使用以下命令优化一些C++ ()我不知道如何预取整个结构。 我不明白有多少const void *addr被读取了。
浏览 0
提问于2011-12-11
得票数 21
回答已采纳
4
回答
在迭代简单的二维数组的同时提高缓存性能?
、
、
我一直在尝试想一种方法来重写下面的代码,以提高数组中的缓存性能(通过减少缓存中的未命中)。for (c = 0; c < 50; c++) ary[d][c] = ary[d][c] + 1;
浏览 0
提问于2012-11-28
得票数 4
回答已采纳
1
回答
霓虹灯增加运行时间
、
我目前正在尝试优化我的一些图像处理代码,以使用霓虹灯指令。float* l_ptrGauss_pf32 = [...];{ *l_ptrLaplace_p
浏览 0
提问于2017-03-13
得票数 0
1
回答
在c中使用文件支持的mmap预取
、
、
、
我正在考虑使用类似于__
builtin_prefetch
()的东西 __
builtin_prefetch
(mmap_base + ((struct my_struct *)(mmap_base + current_item看起来__
builtin_prefetch
()对mmap编辑的内存并没有什么用处。
浏览 3
提问于2020-08-12
得票数 0
回答已采纳
1
回答
令人困惑的函数名
、
、
AVS_Wrapper (compiler: MinGW GCC - 2/17/2015) ===|avs2\include\win32/aiw.h:247:6: error: variable or field '__
builtin_prefetch
' declared v
浏览 5
提问于2015-03-09
得票数 0
回答已采纳
2
回答
C中的缓存管理
、
、
例如,我知道我们可以使用内置函数__
builtin_prefetch
将数据移动到缓存,以减少缓存丢失,从而减少延迟。
浏览 8
提问于2014-11-05
得票数 3
回答已采纳
1
回答
如何利用neon本质矢量化二维阵列
、
、
、
、
我试图添加50个元素的2D数组使用霓虹灯内禀,这是我的代码,有什么更好的方法来做它或优化它吗?uint8x16_t va,vb,res;unsigned char *arr;//j=0;for (i=0;i<size;i+=1
浏览 5
提问于2022-03-21
得票数 1
2
回答
了解在Intel/AMD 64位上使用C语言预取缓冲区的最佳资源
、
、
、
我对掌握与预取相关的函数很感兴趣,比如因此,当我在数组上执行循环操作时,内存带宽得到了充分利用。了解这方面的最好资源是什么?
浏览 2
提问于2008-10-29
得票数 9
回答已采纳
1
回答
在arm gnueabi-g++的目标中添加预取功能
、
、
、
、
__
builtin_prefetch
(&some_variable,0,3); arm-linux-gnueabi-g++-4.7 -O0 -S -std=c++11 main.cpp
浏览 3
提问于2016-05-11
得票数 0
回答已采纳
2
回答
有没有办法让一个空的boost循环缓冲区的前端在缓存中保持热?
、
、
、
有一个特定的循环缓冲区,我希望在缓存中保持热,但是它可以在很长一段时间内不使用。这会导致缓存未命中。当循环缓冲区为空时,是否有任何使用公共接口的操作可以使插入点在缓存中保持热?
浏览 5
提问于2018-01-08
得票数 0
2
回答
如何预取不常用的代码?
、
、
我想把一些代码预取到指令缓存中。代码路径不经常使用,但我需要它在指令缓存中,或者至少在极少数使用它的情况下在L2中。我对这些罕见的案例有一些预先的通知。_mm_prefetch是否适用于代码?有没有办法把这些不常用的代码放到缓存中?对于这个问题,我不关心可移植性,所以即使是asm也可以。
浏览 1
提问于2013-04-25
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券