开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

我可以在多核x86 CPU上强制缓存一致吗？

在多核x86 CPU上，缓存一致性是一个重要的问题。缓存一致性是指多个CPU核心的缓存之间保持数据的一致性。在多核处理器中，每个核心都有自己的缓存，这些缓存可以提高处理速度，但是它们也可能导致数据不一致的问题。为了解决这个问题，处理器提供了一些机制来确保缓存一致性。

在x86架构中，主要有两种方式来实现缓存一致性：

强制写缓存一致性（Force Write Cache Coherency，FWCC）：这种方式是通过使用特殊的指令来强制将数据写入缓存和内存保持一致。这种方式可以确保多个CPU核心之间的数据一致性，但是它可能会增加处理器的负担，因为每次写入操作都需要执行额外的指令。
强制读缓存一致性（Force Read Cache Coherency，FRCC）：这种方式是通过使用特殊的指令来强制将数据从内存读取到缓存中，以确保多个CPU核心之间的数据一致性。这种方式可以确保多个CPU核心之间的数据一致性，但是它可能会增加处理器的负担，因为每次读取操作都需要执行额外的指令。

总的来说，在多核x86 CPU上，可以使用强制写缓存一致性和强制读缓存一致性来确保多个CPU核心之间的数据一致性。但是，这种方式可能会增加处理器的负担，因为每次操作都需要执行额外的指令。如果您的应用程序需要高性能，则应该考虑使用其他方式来实现缓存一致性，例如使用锁或者原子操作来确保数据的一致性。

相关搜索:我可以在多核处理器上使用OpenACC吗？在多核CPU上运行的多个JVM会相互阻塞吗？在CPU上可以使用NCHW格式吗？我可以在PWA中缓存“外部”图像吗？我可以在一个特定的缓存上使用JavaSerializationMarshaller()，在其他缓存上使用protobufs吗？我可以强制heroku在http而不是https上运行我的应用吗？nodejs 我可以强制Maven 2要求在命令行上指定属性吗？我可以在C#中强制清理内存吗？我可以在Mobx上使用NativeBase吗？我可以在@OneToMany上使用@JoinColumn吗？我可以在JPanels上使用actionListeners吗？我可以在sendgrid上使用Javascript吗？我可以在monad上使用map吗？我可以在返回Mono的方法上使用带条件的Spring缓存提取吗？我可以在Groovy中覆盖强制转换运算符吗？我可以在python函数的参数中强制使用lambda吗？我可以在Python列表上创建"视图"吗？我可以在Spring WebFlux上实现WebSecurityConfigurerAdapter吗我可以在矩阵上使用toBinaryString函数吗我可以在Mac上命名VeraCrypt卷吗？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

CPU高速缓存与内存屏障

CPU高速缓存 cpu高速缓存的由来在CPU的全部取指令周期中(程序计算),至少需要访问一次存储器(也就是我们所说物理内存上的数据) 通常需要多次访问存储器的取操作数或者保存结果,CPU处理计算的速度明显受限于访问存储器的限制...在一个多核且每核都有对应的缓存的处理器进行读写操作假设有一个CPU缓存了主内存上的某一段数据,在另一个CPU上需要对该内存段的数据进行写操作,此时在写数据的CPU更新了缓存而其他CPU并没有更新到缓存...,这时候便会产生缓存数据的不一致性缓存一致性约定如何解决上述的问题,出现缓存数据不一致的原因如下: 多核CPU都有对应的高速缓存,每核缓存的数据都无法共享这时候我们会想到就是让缓存能够为多核CPU...内存屏障指令写内存屏障,在指令后插入Store Barrier,能让写入缓存中最新的数据更新写入主内存,让其他线程可见.强制写入主内存,这种显示调用,CPU就不会因为性能考虑而去对指令重排读内存屏障...,在指令前插入Load Barrier,可以让高速缓存中的数据失效,强制从新主内存中加载数据读取主内存内容,让CPU缓存与主内存保持一致,避免缓存导致的一致性问题完全内存屏障,保障了早于屏障的内存读写操作的结果提交到内存之后

1.8K3 0

内存避障的前世今生

（ARM架构单核无法保证顺序一致性、X86架构单核可以保证顺序一致性，因为X86单核多指令队列但会把结果重排输出，结果顺序看起来和输入一样）。...ok在单核能保证顺序一致性的前提下继续讨论（X86），在多核场景下，MESI保证了多核间缓存数据的强一致性。...在顺序一致的世界中，其他处理器看到的顺序应该和第三个处理器一样，所有处理器应该都能看到一样的事件队列。在多核处理器上，很多事情可以同时发生，除非涉及内存访问。...参考上一篇中的实例内存避障fence（一）一个内存乱序实例可知，x86不提供多核场景下的顺序一致性，但保证单核的顺序一致性。 x86单核上多指令队列也是乱序执行的，为什么能保证一致性？ ....注意ARM在单核上也没有顺序一致性的保证。简单的解释是：多核之间不存在一个串行化的总线去访问内存，而是每个内核写自己的缓存，通过MESI协议做同步。 2 为什么X86多核不能提供顺序一致性？

7171 0

网络设备硬核技术内幕路由器篇 16 DPDK及其前传(一)

事实上，不仅限于在运营商领域，同时，在IDC中，基于网元虚拟化实现的vSwitch以及LB/防火墙等增值业务，也大行其道。这些NFV软件运行的平台，就是基于x86的多核处理器平台。...由于x86上运行的传统Linux的架构限制，x86多核一直无法实现高性能的数据转发，因此，英特尔牵头开发的DPDK(Data Plane Development Kit)已经成为了NFV的标配，各大互联网企业招聘网络业务开发...H3C的工程师们在开发过程中发现，简单地将网络操作系统中软转发模块在多个CPU上运行，性能并没有线性提升。...实际上，在多核处理器并行处理数据包时，绝大多数情况下，每一个数据包是可以根据hash算法，负载分担到不同的处理器进行处理的。...另外，多核实现路由器时，还有一个地方容易引发缓存冲突，大家知道是哪里吗？

7112 0

字节终面：CPU 是如何读写内存的？

而x86下无此限制，一条机器指令操作的数据可以来自于寄存器也可以来自内存，因此这样一条机器指令在执行过程中会首先从内存中读取数据。...多核cache一致性有的同学可能已经发现了，问题出在了内存中一个X变量在C1和C2的cache中有共计两个副本，当C1更新cache时没有同步修改C2 cache中X的值。 ? 解决方法是什么呢？...当然，这还只是简单的读，写就更加复杂了，实际上，现代CPU中有一套协议来专门维护缓存的一致性，比较经典的包括MESI协议等。为什么程序员需要关心这个问题呢？...到目前为止，是不是CPU读写内存没有看上去那么简单？现代计算机中CPU和内存之间有多级cache，CPU读写内存时不但要维护cache和内存的一致性，同样需要维护多核间cache的一致性。 ?...这一过程涉及到的硬件以及硬件逻辑包括：L1 cache、L2 cache、L3 cache、多核缓存一致性协议、MMU、内存、磁盘；软件主要包括操作系统。

2.7K2 1

关于这个知识点，我被读者骂到回家种田

于是，这位读者一气之下把我删掉了，在删好友之前，还叫我回家种田。说实话，你说我菜我是承认的，但你要我回家种田，我不理解。为什么要回家种田呢？养猪不比种田赚钱吗？...读者的观点针对这位读者的几个观点： volatile 关键字的底层实现就是 lock 指令 lock 指令触发了缓存一致性协议 JMM 靠缓存一致性协议保证我先给出我的看法：第一点我认为是对的，这个我在...在单核时代，CPU 既享受到了缓存带来的便利，又不用担心数据会出现不一致。但这一切的前提建立在“单核”。多核时代的到来打破了这种平衡。...我认为是没有什么关系的。只不过 lock 前缀指令一部分功能能达到内存屏障的效果罢了。这一点在《IA-32 架构软件开发人员手册》上也能找到对应的描述。...JMM 想表达的是，在某种程度上，你可以通过一些 Java 关键字让 Java 的内存模型达到一种强一致性。所以 JMM 和缓存一致性协议并不挂钩，本质上就没什么联系。

4583 0

郭健：进程切换分析之——TLB处理

在多核系统中，进程切换的时候，TLB的操作要复杂一些，主要原因有两点：其一是各个cpu core有各自的TLB，因此TLB的操作可以分成两类，一类是flush all，即将所有cpu core上的tlb...另外一个原因是进程可以调度到任何一个cpu core上执行（当然具体和cpu affinity的设定相关），从而导致task处处留情（在各个cpu上留有残余的tlb entry）。...在多核系统中，如果cpu支持PCID并且在进程切换的时候不flush tlb，那么系统中各个cpu中的tlb entry则保留各种task的tlb entry，当在某个cpu上，一个进程被销毁，或者修改了自己的页表...在x86支持PCID（X86术语，相当与ARM的ASID）的情况下会怎样呢？也会在load cr3的时候flush掉所有的本地CPU上的 local tlb entry吗？...和x86不同的是：ARM64支持了ASID（类似x86的PCID），难道ARM64解决了TLB Shootdown的问题？其实我也在思考这个问题，但是还没有想明白。

3.2K3 1

java - CAS底层原理及与synchronized的对比

他的原子性是由硬件指令实现的，底层硬件通过将 CAS 里的多个操作在硬件层面语义实现上，通过一条处理器指令保证了原子性操作。...在IA64，x86 指令集中有cmpxchg指令完成 CAS 功能，在 sparc-TSO 也有 casa 指令实现，而在 ARM 和 PowerPC 架构下，则需要使用一对 ldrex/strex 指令来完成...在精简指令集的体系架构中，则通常是靠一对儿指令，如：load and reserve 和 store conditional 实现的，在大多数处理器上 CAS 都是个非常轻量级的操作，这也是其优势所在。...怎么实现的它采用了缓存锁定现在都是多核 CPU 处理器，每个 CPU 处理器内维护了一块字节的内存，每个内核内部维护着一块字节的缓存，当多线程并发读写时，就会出现缓存数据不一致的情况。...，基于 MESI 缓存一致性协议来实现的。

1.2K1 0

进程切换分析（2）：TLB处理

为了能够讲清楚这个问题，我们在第二章描述在单CPU场景下一些和TLB相关的细节，第三章推进到多核场景，至此，理论部分结束。...另外一个原因是进程可以调度到任何一个cpu core上执行（当然具体和cpu affinity的设定相关），从而导致task处处留情（在各个cpu上留有残余的tlb entry）。...在多核系统中，如果cpu支持PCID并且在进程切换的时候不flush tlb，那么系统中各个cpu中的tlb entry则保留各种task的tlb entry，当在某个cpu上，一个进程被销毁，或者修改了自己的页表...在x86支持PCID（X86术语，相当与ARM的ASID）的情况下会怎样呢？也会在load cr3的时候flush掉所有的本地CPU上的 local tlb entry吗？...和x86不同的是：ARM64支持了ASID（类似x86的PCID），难道ARM64解决了TLB Shootdown的问题？其实我也在思考这个问题，但是还没有想明白。

2671 1

Memory Consistency and Cache Coherence —— 内存一致性

这些优化技术在单核cpu下对程序不会有任何影响，但是在多核cpu下编写多线程程序如果不加保护，会发生一些意想不到的结果。...cpu乱序执行，但是通过推测来隐藏顺序一致性访存的延迟技术，反应到访存顺序上和程序顺序一致。这就是cpu设计人员利用推测处理器的延迟提交功能实现乱序执行下具有顺序一致性的特性。...2.支持cpu简单的推测，在具有强一致性模型的系统中，cpu可以在准备好提交之前，推测性地乱序执行load。支持SC的MIPS R10000就是使用了这种特性提高了性能。...看一在宽松一致性模型个例子 data1 data2初始化为0，flag不等于set，r2和r3会全部等于0吗。...深入理解宽松的模型（例如，编写编译器和运行时系统）是很困难的，所以宽松一致性模型是在可编程性是劣于SC和TSO的 2.性能：宽松的内存模型可以提供比TSO更好的性能，但是对于许多核心微架构而言，差异很小

1.6K1 0

一文解读 CPU 多级缓存 & 缓存一致性协议（MESI）

CPU 多级缓存 & 缓存一致性协议（MESI）CPU 多级缓存参考：Java Memory Model缓存一致性协议（MESI）多级缓存的出现解决了CPU处理速度和内存读取速度不一致的问题，但是同时也带来缓存不一致的问题.../Jeremy.Jones/VivioJS/caches/MESIHelp.htmMESI优化和引入的问题在上述多核CPU为保证缓存一致性进行协同的过程中，消息传递的时间远远大于CPU执行时间，如果每次的操作都需要等待协同指令响应完成...Store Bufferes & Invalidate Queue从上述的多核协同案例中我们可以发现，每次修改缓存中的元素，都需要将无效状态指令（Invalidate Acknowledge）执行完才能将修改的数据写回缓存行中...导致 Store Bufferes 写入缓存行和执行 Invalidate Acknowledge 的时机需要十分合适才能尽可能释放CPU的处理能力，实际上CPU并不知道什么时候会执行，因此将这个任务留给了写程序的人...在我的博客上，你将找到关于Java核心概念、JVM 底层技术、常用框架如Spring和Mybatis 、MySQL等数据库管理、RabbitMQ、Rocketmq等消息中间件、性能优化等内容的深入文章。

80710 0

缓存失效确实是计算机科学中最难的问题之一

如果您是一名计算机工程师，正在设计一个多核系统，其中每个内核都有内核缓存，您的系统必须针对称为缓存一致性的问题实施解决方案。...缓存一致性想象一个多线程程序，其中每个线程都在不同的内核上运行：线程 T1 在 CPU 1 上运行线程 T2 在 CPU 2 上运行程序使用了一个变量，我们称之为x。...这个问题是通过一个叫做缓存控制器的硬件设备来解决的。缓存控制器可以检测缓存中的值何时在一个内核上被修改，以及另一个内核是否缓存了相同的数据。在这种情况下，缓存控制器会使陈旧的缓存无效。...当CPU从主存读取时，存放变量x的内存会被带入缓存。但是 CPU 不会只是将变量x读入缓存。它会将包含变量x的连续内存块读取到缓存中。在 x86 系统上，这个块的大小是 64 字节。...在这个特定的 CPU 架构上，指针是 64 位或 8 字节。L1 缓存行大小为 64 字节。这意味着一个缓存行可以存储 8 个指针。换个说法，一个指针可以占据高速缓存行中 8 个位置中的一个。

3991 0

C和C++中的volatile、内存屏障和CPU缓存一致性协议MESI

volatile在C/C++中的作用： 1) 告诉编译器不要将定义的变量优化掉； 2) 告诉编译器总是从缓存取被修饰的变量的值，而不是寄存器取值。...7. x86-TSO x86-TSO是Intel推出的一种CPU内存一致性模型，特点是只有“Store Load”一种情况会重排序，也就是“Load”可以排（乱序）在“Store”的前面，因此不需要...附1：CPU、缓存和主存第三级缓存（L3 Cache）多核共享： ? ?...CPU缓存一致性协议） https://en.wikipedia.org/wiki/MESI_protocol 13) MESIF（多核CPU缓存一致性协议） https://en.wikipedia.org...Cache中 E 独占互斥（Exclusive）该Cache line只被缓存在该CPU的缓存中，它是未被修改过的（clean），与主存中数据一致 S

3.7K4 0

性能之殇：从冯·诺依曼瓶颈谈起

多核 CPU 多核 CPU 的每一个核心拥有自己独立的运算单元、寄存器、一级缓存、二级缓存，所有核心共用同一条内存总线，同一段内存。...实际上，多核 CPU 性能的提升极其有限，远不如增加一点点单核频率提升的性能多。优势多核 CPU 的优势很明显，就是可以并行地执行多个图灵机，可以显而易见地提升性能。...，7 可以自动调配一个进程在多个核心上游走，2008R2 解决了依赖 CPU0 调度导致死机的 bug（中国的银行提的 bug 哦），8 可以利用多核心启动，10 优化了杀进程依赖 CPU0 的问题。...CPU 核心上同时运行，而我们都知道在微观上在任一个时刻，每一个 CPU 核心都只能运行一条指令。...分布式计算在大热的同时，也存在着两台机器也要硬上 Hadoop 的「面向简历编程」，接下来我就剖析一下分布式计算的本质，以及我的理解和体会。

1.3K2 0

1.什么是CPU多级缓存模型？

小陈：老王，最近学习并发不知如何入手，看的知识很零散；没多久又记不住了，你有啥好建议吗? 老王：来我这，我给你整理一下并发的知识和学习路线，能形成一个比较全面的知识图谱。...老王：我们先从CPU的多级缓存架构讲起，下面我画个图说一下CPU多级缓存架构：计算机为什么要设计高速缓存架构？小陈：CPU和主内存之间为啥要有个高速缓存，CPU直接读写内存不可以吗？...小陈：CPU和主存之间引入高速缓存的目的我知道了，就是为了减少CPU的等待时间，提高执行效率嘛，那多核CPU的多级缓存架构是怎样的？...老王：再给你画一张图，你就知道多核CPU的多级缓存架构是怎样的了：如上图所示，现代计算机一般都是多核CPU的，其中每个CPU都有自己的高速缓存，其中主内存是共用的。...多核CPU的多级缓存架构带来的缓存数据一致性问题小陈：看了多核CPU的多级缓存架构图，这样相当于每个CPU都有自己的缓存吗？这样不会导致各个CPU的缓存之间数据不一致的问题吗？

3043 0

Frequently Asked Questions on seL4

我可以在seL4上运行Linux吗？是的，seL4可以在虚拟机上运行Linux。目前这是仅支持x86处理器，同时seL4要求机器支持英特尔 EPT VT-X。...VMM运行在脱特权模式（x86 Ring-3 根模式或ARM supv模式）。 seL4支持多核吗？在x86上，seL4可以配置为支持多个CPU。...目前多核的支持是通过一个多核配置实现，每个启动CPU被分配一部分可用内存。然后，内核可以通过受限的共享内存和内核支持的IPI通信。我可以在一个没有MMU的微控制器上运行seL4吗？...此外，也有证明来证实seL4的规格，如果使用得当，会强制完整性和保密性，核心安全属性。结合上面提到的证明，不仅在内核模型上（规范），也在执行的二进制的硬件上，这些属性都被保证强制实施。...虽然这些限制对高保障系统是常见的，我们正在努力地以减少它们，例如通过在x86上使用IOMMU或在ARM上使用System MMU。如果我运行了seL4，我的系统就是安全吗？这并不是自动保证的。

1.5K5 0

【深度长文】学好并发编程不一定需要了解的MESI和内存屏障

学好并发编程不一定需要了解的MESI和内存屏障开篇一、不同CPU设计的区别单核CPU 单核+高速缓存多核CPU + 高速缓存二、缓存一致性协议（MESI）缓存行的状态 Exclusive Modified...一台机器的性能取决于cpu在一个时钟周期内可执行的单元数量。 cpu、高速缓存、memory的速度差异多核CPU + 高速缓存为了解决上一个时代，单核cpu的性能瓶颈。...因此这是一个锁粒度和开销都很大的操作优点：多核CPU并行工作提升了计算机的处理速度缺点：带来了缓存一致性问题总线锁的方式开销太大二、缓存一致性协议（MESI）由于通过总线锁的方式来保证一致性所带来的性能开销太大...-高速缓存抽象为线程-工作内存（存放于JVM栈中）主内存抽象为主内存（存放于JVM堆中）对于CPU-高速缓存-主存来说，都是在物理意义上完全独立的硬件设备。...理解上可以线程-工作内存-主存等价于 CPU-Cache-主存。但实际上是不能划等号。

6931 0

计算机基础 | 多核、缓存...现代CPU是如何工作的

比如，一个加法运算，在x86处理器上的的二进制代码为： 01001000 00000001 11000011 这样一行代码被称为机器码，它执行了加法操作。...比较常见的指令集有x86、ARM、MIPS、SPARC、Power等。x86和ARM被广泛应用在我们身边的电子产品上，相对比较知名，此外，龙芯实现了MIPS，IBM小型机则采用Power指令集。 ?...通常，CPU的寄存器只有几KB。L1 Cache和L2 Cache一般设计在CPU上，访问延迟在几纳秒只几十纳秒内，主存的访问延迟在百纳秒内。速度越快，意味着成本越高。...多核多线程多核架构提供给用户多个可以独立计算的核心，这也意味着计算机可以同时并行执行多项任务，即并行计算。某个计算任务在某个核中进行，被称作线程。多个核处理多个任务通常被称为多线程。...由于两个线程相隔时间太短，加上前面所说的缓存机制，计算的过程和临时结果在了寄存器和L1缓存，还没来得及写到主存上。线程B读到的数据是线程A没写回内存中的数据，这样就出现了数据不一致的情况。

1.6K2 0

OpenACC编译器也有免费午餐吃了！

---- PGI Community Edition可以在Linux上吗? 窗户吗? OS X ?...---- PGI Community Edition 可以在x86和OpenPOWER cpu 上使用么? 是的。 ---- PGI Community Edition可用在ARMcpu上吗?...---- 是否PGI Community Edition也支持OpenACC多核cpu和OpenMP吗? 是的，跟PGI收费编译器的OpenACC多核cpu和OpenMP功能一样的。...---- PGI Community Edition包括PGPROF分析器和PGDBG调试器吗? 是的，在x86 PGPROF和PGDBG都包括在内。...---- 我可以在我的集群头节点上安装Community Edition PGI，在我组织内，允许多个用户访问吗? 是的，但是他们必须在您的组织。

2.5K7 0

一条防火墙招标参数引发的讨论

人家有错吗？你怎么又忘记了以客户为中心思考问题了？难道你不想花最少的钱买最好的东西吗？...这里有必要做一个科普，当前业界主流的下一代防火墙硬件架构有两类，一类是“X86”架构，采用Intel处理芯片；另一类则是所谓的“多核”架构（其实这么叫并不准确，因为X86所采用的Intel也早就是多核了...，专业上应被称为“MIPS”）。...，这样才能保证下一代防火墙在同时开启多种安全功能的情况下，性能依然可以维持在可用的范围，而这一点却是MIPS所比不了的。...由于X86架构灵活扩展的特性，高端的盒式X86设备普遍会采用两颗CPU，这样其缓存容量就会翻倍为60M，这个差距就更加明显了。

1.9K5 0

浅墨: 聊聊原子变量、锁、内存屏障那点事(1)

突然想聊聊这个话题，是因为知乎上的一个问题多次出现在了我的Timeline里：请问，多个线程可以读一个变量，只有一个线程可以对这个变量进行写，到底要不要加锁？...注意这里我加粗了单核CPU这个关键字，那么到了多核心处理器的今天，该操作就不是原子了吗？不，依旧是原子的，但是出现了其他的干扰因素迫使可能需要额外的同步措施才能保证原本无锁代码的正确运行。...从此单核时代CPU的Self-Consistent特性在多核时代已不存在，多核CPU作为一个整体看，不再满足Self-Consistent特性。...以前写过一篇《浅析x86架构中cache的组织结构》，这里不再赘述。既然各个核心之间有独立的Cache存储器，那么这些存储器之间的数据同步就是个比较复杂的事情。缓存数据的一致性由缓存一致性协议保证。...缓存一致性协议的细节超出了本文的讨论范围，有兴趣的读者可以自行研究。传统的MESI协议中有两个行为的执行成本比较大。

1.3K3 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭