专栏首页架构技术专栏每日一个知识点:Volatile 和 CAS 的弊端之总线风暴
原创

每日一个知识点:Volatile 和 CAS 的弊端之总线风暴

每日一个知识点系列的目的是针对某一个知识点进行概括性总结,可在一分钟内完成知识点的阅读理解,此处不涉及详细的原理性解读。

一、什么是总线风暴

总线风暴,听着真是一个帅气的词语,但如果发生在你的系统上那就不是很美丽了,废话不多说,先看图说结论。

img

什么是总线风暴,先来看结论

在java中使用unsafe实现cas,而其底层由cpp调用汇编指令实现的,如果是多核cpu是使用lock cmpxchg指令,单核cpu 使用compxch指令。如果在短时间内产生大量的cas操作在加上 volatile的嗅探机制则会不断地占用总线带宽,导致总线流量激增,就会产生总线风暴。 总之,就是因为volatile 和CAS 的操作导致BUS总线缓存一致性流量激增所造成的影响。

img

二、一些需要的基础知识

这里有些基础需要铺垫下,了解过volatile和cas 的朋友都知道由于一个变量在多个高速缓存中都存在,但由于高速缓存间的数据是不共享的,所以势必会有数据不一致的问题,为了解决这种问题处理器是通过总线锁定缓存锁定这两个机制来保证复杂内存操作的原子性的。

img

1、总线锁

在早期处理器提供一个 LOCK# 信号,CPU1在操作共享变量的时候会预先对总线加锁,此时CPU2就不能通过总线来读取内存中的数据了,但这无疑会大大降低CPU的执行效率。

2、缓存一致性协议

由于总线锁的效率太低所以就出现了缓存一致性协议,Intel 的MESI协议就是其中一个佼佼者。MESI协议保证了每个缓存变量中使用的共享变量的副本都是一致的。

3、MESI 的核心思想

modified(修改)、exclusive(互斥)、share(共享)、invalid(无效)

如上图,CPU1使用共享数据时会先数据拷贝到CPU1缓存中,然后置为独占状态(E),这时CPU2也使用了共享数据,也会拷贝也到CPU2缓存中。通过总线嗅探机制,当该CPU1监听总线中其他CPU对内存进行操作,此时共享变量在CPU1和CPU2两个缓存中的状态会被标记为共享状态(S);

若CPU1将变量通过缓存回写到主存中,需要先锁住缓存行,此时状态切换为(M),向总线发消息告诉其他在嗅探的CPU该变量已经被CPU1改变并回写到主存中。接收到消息的其他CPU会将共享变量状态从(S)改成无效状态(I),缓存行失效。若其他CPU需要再次操作共享变量则需要重新从内存读取。

缓存一致性协议失效的情况:

  • 共享变量大于缓存行大小,MESI无法进行缓存行加锁;
  • CPU并不支持缓存一致性协议

4、嗅探机制

每个处理器会通过嗅探器来监控总线上的数据来检查自己缓存内的数据是否过期,如果发现自己缓存行对应的地址被修改了,就会将此缓存行置为无效。当处理器对此数据进行操作时,就会重新从主内存中读取数据到缓存行。

5、缓存一致性流量

通过前面都知道了缓存一致性协议,比如MESI会触发嗅探器进行数据传播。当有大量的volatile 和cas 进行数据修改的时候就会产大量嗅探消息。

三、总结性言论

通过上面一顿巴拉,大家应该对开局图有一定的了解了,也大概知道了总线风暴的原因。这里再做一下概括性的总结(当前内部还有很有详细的机制,大家感兴趣可以撸一波)

在多核处理器架构上,所有的处理器是共用一条总线的,都是靠此总线来和主内存进行数据交互。当主内存的数据同时存在于多个处理的高速缓存中时,某一处理器更新了此共享数据后。会通过总线触发嗅探机制来通知其他处理器将自己高速缓存内的共享数据置为无效,在下次使用时重新从主内存加载最新数据。而这种通过总线来进行通信则称之为”缓存一致性流量“。

因为总线是固定的,所有相应可以接受的通信能力也就是固定的了,如果缓存一致性流量突然激增,必然会使总线的处理能力受到影响。而恰好CAS和volatile 会导致缓存一致性流量增大。如果很多线程都共享一个变量,当共享变量进行CAS等数据变更时,就有可能产生总线风暴。

img

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 大数据平台搭建神器,Ambari HDP集群搭建全攻略

    Apache Ambari是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。

    架构技术专栏
  • 来,我们在重新说下,线程状态?

    每当线上应用出现各种吞吐下降、RT增长、CPU飚高、内存溢出等问题的时候是不是脑阔疼。面对出现的问题,简直就是无从下口啊。

    架构技术专栏
  • 干货 | 14张图解读并发底层原理

    前两天我搞了两个每日一个知识点,对多线程的部分知识做了下概括性的总结。但通过小伙伴的反馈是,那玩意写的比较抽象,看的云里雾里晕晕乎乎的。所以又针对多线程底层这一...

    架构技术专栏
  • 大量ECAgent报错

    电脑的突然变卡,检查任务管理器发现了大量的ECAgent的进程,而且不断的产生中,很是苦恼!

    @坤的
  • python干货| python3利用SMTP进行邮件Email自主发送

    利用python进行邮件的发送,这个功能自我感觉主要应用于检测或者报告之类,我两次运用这个功能。

    Python进击者
  • JavaWeb| JSTL标签库看这篇文章就够了!(含案例)

    今天给大家写一篇Web系列的文章,大部分人可能会觉得Web的东西很基础,如果这方面你很精通了可以忽略,但是我还是想出一系列的文章去帮助刚刚入门的小伙伴。

    Python进击者
  • 2018CCF颁奖大会在京隆重举行

    2018CCF颁奖大会于2019年1月19日在北京金隅喜来登酒店隆重举行。颁奖会以“责任•创新•奉献”为主题,颁发了2018年度CCF终身成就奖、CCF夏培肃奖...

    量子位
  • 【动手学深度学习】笔记一

    torch.Tensor是存储与变换数据的主要工具。Tensor(张量)是一个多维数组,标量可以看作是0维张量,向量可以看作是1维张量,矩阵可以看作是2维张量。

    树枝990
  • MySQL参数是啥,你知道吗?

    在前面一些文章中,经常能看到介绍某某参数的作用,可能有些小伙伴仍搞不清楚 MySQL 参数是啥。本篇文章我们来聊聊 MySQL 参数,学习下如何管理维护 MyS...

    MySQL技术
  • 「数字化」数字化转型指南 - 第2部分

    本文的第一部分定义了“数字”一词,并引入了一个标记为数字转换框架(DTF)的参考框架,以帮助组织更好地理解和模拟数字策略。 还详细介绍了框架的内在要素,以便了解...

    首席架构师智库

扫码关注云+社区

领取腾讯云代金券