专栏首页艾小仙真实字节二面:什么是伪共享?

真实字节二面:什么是伪共享?

这个问题来自最近一个朋友字节面试碰到的,最后他也成功拿到了字节offer,这个问题我想可能挺多人不太清楚,所以想拿出来单独说一说。

好了,让我们进入正题。

什么是伪共享

首先大家都知道,随着CPU和内存的发展速度差异的问题,导致CPU的速度远远快于内存,所以一般现在的CPU都加入了高速缓存,就是常说的解决不同硬件之间的性能差异问题。

这样的话,很简单的道理,加入了缓存,就必然会导致缓存一致性的问题,由此,又引入了缓存一致性协议。(如果你不知道,建议去百度一下,这里不做展开)

CPU缓存,顾名思义,越贴近CPU的缓存速度越快,容量越小,造价成本也越高,而高速缓存一般可以分为L1、L2、L3三级缓存,按照性能的划分:L1>L2>L3。

而事实上,数据在缓存内部都是按照来存储的,这就叫做缓存行。缓存行一般都是2的整数幂个字节,一般来说范围在32-256个字节之间,现在最为常见的缓存行的大小在64个字节。

所以,按照这个存储方式,缓存中的数据并不是一个个单独的变量的存储方式,而是多个变量会放到一行中。

我们常说的一个例子就是数组和链表,数组的内存地址是连续的,当我们去读取数组中的元素时,CPU会把数组中后续的若干个元素也加载到缓存中,以此提高效率,但是链表则不会,也就是说,内存地址连续的变量才有可能被放到一个缓存行中

在多个线程并发修改一个缓存行中的多个变量时,由于只能同时有一个线程去操作缓存行,将会导致性能的下降,这个问题就称之为伪共享

为什么只有一个线程能去操作?我们举个实际的栗子来说明这种情况:

假设缓存中有x,y两个变量,他们同时已经在不同的三级缓存之中。

这时有两个线程A和B同时去修改位于Core1和Core2的变量xy

如果线程A去修改Core1的缓存中的x变量,由于缓存一致性协议,Core2中对应的缓存了x,y变量的缓存行将会失效,他会被强制从主内存中重新去加载变量。

这样的话,频繁的访问主内存,缓存基本都失效了,将会导致性能的下降,这就是伪共享的问题。

如何避免?

既然已经知道了什么是伪共享,那么怎么避免这种情况的发生?

改变行存储的方式?想都别想了。

剩下可行的方法就是填充,如果这一行只有我这一个数据那不就好了吗?

确实就是这样,解决方式通常有以下两种。

字节填充

在JDK8之前,可以通过填充字节的方式来避免伪共享的问题,如下代码所示:

自定义填充

一般而言,缓存行有64字节,我们知道一个long是8个字节,填充5个long之后,一共就是48个字节。

而 Java 中对象头在32位系统下占用8个字节,64位系统下占用16个字节,这样填充5个long型即可填满64字节,也就是一个缓存行。

@Contented注解

JDK8以及之后的版本 Java 提供了sun.misc.Contended 注解,通过@Contented注解就可以解决伪共享的问题。

注解方式

使用@Contented注解后会增加128字节的padding,并且需要开启-XX:-RestrictContended选项后才能生效。

所以,通过以上两种方式你会发现,对象头大小和缓存行的大小都和操作系统位数有关,JDK的注解帮你解决了这个问题,所以推荐尽量使用注解的方式来实现。

虽然解决了伪共享问题,但是这种填充的方式也浪费了缓存资源,明明只有8B的大小,硬是使用了64B缓存空间,造成了缓存资源的浪费。

而且我们知道,缓存又小又贵,时间和空间的取舍要自己酌情考虑。

实际应用

在Java中提供了多个原子变量的操作类,就是比如AtomicLongAtomicInteger这些,通过CAS的方式去更新变量,但是失败会无限自旋尝试,导致CPU资源的浪费。

为了解决高并发下的这个缺点,JDK8中新增了LongAdder类,他的使用就是对解决伪共享的实际应用。

LongAdder继承自Striped64,内部维护了一个Cell数组,核心思想就是把单个变量的竞争拆分,多线程下如果一个Cell竞争失败,转而去其他Cell再次CAS重试。

Striped64成员变量

解决伪共享的真正的核心就在Cell数组,可以看到,Cell数组使用了Contented注解。

在上面我们提到数组的内存地址都是连续的,所以数组内的元素经常会被放入一个缓存行,这样的话就会带来伪共享的问题,影响性能。

这里使用Contented进行填充,就避免了伪共享的问题,使得数组中的元素不再共享一个缓存行。

解决伪共享

好了,今天的内容就到这里,我是艾小仙,我的slogan还没想好,但是我们下次见。

·················END·················

本文分享自微信公众号 - 艾小仙(aixiaoxianren),作者:艾小仙

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-03-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 杂谈 什么是伪共享(false sharing)?

    主内存(RAM)是数据存放的地方,CPU 和主内存之间有好几级缓存,因为即使直接访问主内存也是非常慢的。

    彤哥
  • JAVA 拾遗 — CPU Cache 与缓存行

    最近的两篇文章,介绍了我参加的中间件比赛中一些相对重要的优化,但实际上还存在很多细节优化,出于篇幅限制并未提及,在最近的博文中,我会将他们整理成独立的知识点,并...

    kirito-moe
  • 伪共享和缓存行填充,Java并发编程还能这么优化!

    关于伪共享的文章已经很多了,对于多线程编程来说,特别是多线程处理列表和数组的时候,要非常注意伪共享的问题。否则不仅无法发挥多线程的优势,还可能比单线程性能还差。...

    Bug开发工程师
  • 区块链商用调查

    区块链这么火,它能做什么?与我有什么关系?现实中有哪些应用?这些问题也困绕我许久,通过近期断断续续的关注和了解,略窥一二,分享给大家。

    鹅厂优文
  • 如何从零开始解读产品经理需求分析-需求管理

    3.纷繁世界里有大量的需求,包括真需求,伪需求,因为需要产品经理用自己的判断去甄别,选择需求。

    IT架构圈
  • Ret2dl_resolve漏洞利用分析

    ret2dlresolve是linux下一种利用linux系统延时绑定(Lazy Binding)机制的一种漏洞利用方法,其主要思想是利用dlruntimere...

    FB客服
  • 伪共享

    计算机系统中为了解决主内存与CPU运行速度的差距,在CPU与主内存之间添加了一级或者多级高速缓冲存储器(Cache),这个Cache一般是集成到CPU内部的,所...

    加多
  • Netty高性能FastThreadLocal原理深度剖析

    目前关于FastThreadLocal的很多文章都有点老有点过时了(本文将澄清几个误区),很多文章关于FastThreadLocal介绍的也不全,希望本篇文章可...

    田守枝
  • Disruptor原理探讨

    先介绍一下我的这个服务。这个服务主要是作为游戏服务器的游戏逻辑部分,包括帧同步逻辑及其他在游戏过程中玩家产生的一些业务逻辑。

    健程之道
  • 玮哥:跨越边界才是区块链通证经济最强大的能力

    区块链大本营
  • 区块链智能资产的“硬链接”思考

    区块链大本营
  • 【热点】你真敢ZAO吗?解读换脸AI “细思极恐” 的用户协议

    8月30日晚间,一个名为“ZAO”的APP一夜爆红,有的人尝鲜乐此不疲、有的人则对其中涉及到的隐私问题忧心忡忡。到了第二天,这个APP已经被推到了舆论的风口浪尖...

    昱良
  • 你不好奇 CPU 是如何执行任务的?

    先来认识 CPU 的架构,只有理解了 CPU 的 架构,才能更好地理解 CPU 是如何读写数据的,对于现代 CPU 的架构图如下:

    小林coding
  • 区块链智能资产的“硬链接”思考

    区块链大本营
  • 区块链开发公司浅析能实现物理世界的有效交接吗?

     结合区块链技术大火的趋势,电子签约的区块链应用场景落地,成为此类公司纷纷竞逐的升级方向。这或许也正是让区块链行业脱离空气币刻板印象的一种关键应用,并令其获取真...

    用户3126099
  • 学java就两个问题

    三哥
  • 伪共享(false sharing),并发编程无声的性能杀手

    在并发编程过程中,我们大部分的焦点都放在如何控制共享变量的访问控制上(代码层面),但是很少人会关注系统硬件及 JVM 底层相关的影响因素。前段时间学习了一个牛X...

    周三不加班
  • 3 CPU缓存一致性协议MESi

       然后加载元数据区的方法, 比如refresh()方法. 启动线程后, 首先, 会在线程栈开辟一块栈帧, 然后执行操作数栈  

    用户7798898
  • 一段代码,两倍时差,直击并发编程伪共享

    【闲话开篇】:这段时间项目接近尾声,我终于闲了一点,又拿起了早先未看完的书《JAVA高并发程序设计》,强迫自己学习。看到其中介绍《无锁的缓存框架:Disrupt...

    大道七哥

扫码关注云+社区

领取腾讯云代金券