前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >并发编程中的大坑:你的直觉&有序性问题

并发编程中的大坑:你的直觉&有序性问题

作者头像
京东技术
发布2021-04-22 09:49:07
4870
发布2021-04-22 09:49:07
举报
文章被收录于专栏:京东技术

Tech

引言

并发编程无疑是编程领域中的上甘岭,他的“难”主要体现在两个方面,从宏观上来讲,主要是如何确定最优化的模型,例如Redis是单线程模型,Nginx是多进程单线程模型,而Netty是主从Reactor多线程模型;从微观上来讲,主要是原子性、可见性、有序性等问题的纠缠,这些问题有一个共同点,就是直觉失效。我们大部分情况下都是靠直觉来写程序的,如果直觉失效,会意味着什么呢?意味着直觉在引导我们写bug,引导我们误入歧途。今天我们就重点来聊聊直觉失效的问题之一:有序性问题。相信你看完这篇文章,肯定会大吃一惊:“原来一不小心写了这么多bug!”好在解决方案还是很简单的,只要了解了原理就可能轻松搞定。

01

一个简单的并发程序

在下面的代码中,线程T1执行一个计算任务(简化为data=666),任务完成后通过isReady标识结束了,线程T2等待线程T1完成计算任务(while (!isReady) {}),当线程T2观察到isReady为true时,执行后续任务(简化为r = data + 222),那线程T2能得到预期的结果r==888吗?

int data=0; bool isReady=false;

data=666;isReady=true;

while(!isReady){};int r = data+222;

直觉告诉我们能看到预期的结果888,我们的直觉源自缜密的逻辑推导:线程T1中,首先对data进行了赋值操作,后对isReady进行了赋值操作,所以线程T2中观察到 isReady==true 时,data一定等于666,然后就会得到 r==888。

仅有理论推导还不够,最好跑个程序测试一下,理论联系实践,双保险。于是我们又写了下面这个验证程序,执行数次,并没有发现打印出异常数据。于是我们终于可以得出结论:一切OK!

代码语言:javascript
复制
boolean isReady=false;
int data = 0;
int r;
public void main(String[] args) 
  throws InterruptedException {
  for (int i=0; i<10000; i++) {
    Thread t1=new Thread(()->{
      data = 666;
      isReady = true;
    });
    Thread t2=new Thread(()->{
      while (!isReady) {};
      r = data + 222;
    });
    t2.start();
    t1.start();
        
    t2.join();
    if (r != 888) {
      System.out.println(r);
    }
  }
}

当然了,这一起都是假象,理论推导,其过程没有错,但是假设条件有问题;实践代码也没有问题,但是不够全面。我们先从实践代码开始剖析。

02

用jcstress测试并发程序

Java程序是依赖JVM解释执行,内部还有复杂的JIT优化,这些优化和JVM参数、 版本、以及CPU架构都有关系,和热点代码也有关系,JIT优化对并发测试的影响往往是颠覆式的;另外并发问题往往需要真实竞争,真实竞争指的是多个线程同一时刻在访问共享变量。上面我们的写的测试程序,并不能很好的解决JIT优化、真实竞争的问题。

好在现在已经有了不少并发测试的工具,jcstress是OpenJDK团队开源的并发测试工具,下面我们用jcstress来重写一下上面的测试程序。

代码语言:javascript
复制
@JCStressTest
@Outcome(id = "888", 
  expect=Expect.ACCEPTABLE, 
  desc="符合预期.")
@Outcome(id = "0", 
  expect=Expect.ACCEPTABLE, 
  desc="符合预期.")
@Outcome(
  expect=Expect.ACCEPTABLE_INTERESTING, 
  desc="异常结果.")
@State
public class IsReadyTest {
  int data = 0;
  boolean isReady = false;
    
  @Actor
  void actor1() {
    data = 666;
    isReady = true;
  }
    
  @Actor
  void actor2(I_Result r) {
    if (!isReady) {
      r.r1 = 0;
    } else {
      r.r1 = data + 222;
    }
  }
}

上面的测试程序,每个用 @Actor 注解的方法都会在一个独立的线程中执行,如果需要获得线程执行后的结果,可以将结果回写到 I_Result 中, @Outcome 注解用来验证 I_Result 中的结果是否符合预期。

在actor2()中,我们没有使用while()循环来检查isReady,而是用了if()语句,其验证效果都是一样,如果actor1()没有准备好计算结果,r.r1设置为0;反之,如果actor1()准备好了计算结果,则设置r.r1=data+222,此时r.r1的预期结果是888,所以888和0都符合我们的预期,而其他值则属于异常。

在Java11版本的JVM上执行上面的测试程序,最终的结果如下图所示。

我们发现有一个异常结果是222,出现222的唯一可能就是 isReady==true 并且 data==0,这怎么可能呢?这不就意味以下代码中的惊天大谎吗?

代码语言:javascript
复制
data = 666;
isReady = true;

if (isReady) {
  //测试结果说明此处data等于0!!!
}

actor1()中,首先设置的data=666,然后才设置的isReady=true,直觉以及多年程序员的经验都告诉我们:后续代码如果能读到isReady==true,那么一定能读到data==666。

03

指令重排导致直觉失效

我们的直觉以及多年程序员的经验,在单线程场景中是正确的,在多线程场景中是不适用的。出于性能的考虑,Java编译器(含JIT)、CPU并没有忠实地按照我们代码的书写顺序执行代码,而是自以为是改变了执行顺序,我们一般把编译器、CPU的这种行为称为指令重排。

例如 我们书写的顺序是:

data=666; isReady=true;

而真实的执行顺序可能是:

isReady=true; data=666;

调整顺序后,在单线程上执行没有任何后遗症,例如单线程执行:

代码语言:javascript
复制
isReady = true;
data = 666;

if (isReady) {
  //单线程中此处data仍然等于666!!!
}

但是在多线程场景中,就不一定了,例如当actor1()在执行完 isReady=true 后(尚没有执行data=666),actor2()执行以下代码:

代码语言:javascript
复制
if (isReady) {
  r.r1 = data + 222;
}

由于此时data==0,所以就会得到r.r1 == 222。

04

更匪夷所思的编译器优化

前面我们基于jcstress的测试程序没有使用while()循环来检查isReady,而是用了if()语句,为什么要做这种替换呢?直接用while()循环来验证并发问题不是更直接吗?于是我们得到如下的测试程序:

代码语言:javascript
复制
@JCStressTest
@Outcome(id = "888", 
  expect=Expect.ACCEPTABLE, 
  desc="符合预期.")
@Outcome(
  expect=Expect.ACCEPTABLE_INTERESTING, 
  desc="异常结果.")
@State
public class IsReadyTestError {
  int data = 0;
  boolean isReady = false;
  @Actor
  void actor1() {
    data = 666;
    isReady = true;
  }
  @Actor
  void actor2(I_Result r){
    while (!isReady) {};
    r.r1 = data + 222;
  }
}

你可以放心地执行上面的测试程序,放心吧无毒,但是在执行上面这个测试程序的时候,你将渐渐听到轰鸣的风扇的声音,然后一直轰鸣下去,我想你应该猜到发生什么了,死循环发生了。上面的代码在 while (!isReady) {}; 上死循环,再没机会跳出了。

怎么会这样?actor1()可能会慢于actor2()的执行,但也定也慢不过1秒,那为什么会发生死循环呢?这其实也是编译优化惹的祸。我们直觉总是以为每次while()循环都会重新在内存中读取isReady这个变量,但是实际上,编译优化后的代码,仅仅在第一次循环时读了一次,之后所有的循环都没重新再去内存中读取isReady这个变量,从而导致while()循环死在此处,再也无法跳出。

05

利用volatile解决有序性问题

上面提到的问题我们该如何解决呢?方案很简单,只要将isReady声明为volatile变量就可以了。

int data=0;volatile bool isReady=false;

data=666;isReady=true;

while(!isReady){};int r=data+222;

对于volatile变量,JVM会禁用指令重排,例如代码的书写顺序是这样:

data=666; isReady=true;

由于isReady是volatile变量,所以JVM会禁止 data=666 重排到 isReady=true 的后面。

同样的道理,以下面顺序书写的代码:

var1=isReady; var2=data;

由于isReady是volatile变量,JVM会禁止 var2=data 重排到var1=isReady的前面。

同时volatile变量还会禁用CPU缓存,不会因为CPU缓存导致可见性问题。

06 总结

在Java领域,编写线程安全的并发程序并不容易,首先我们需要解决的就是直觉失效的问题。有人把我们的认知分为四个境界:知道自己知道,知道自己不知道,不知道自己知道,不知道自己不知道,而最大悲剧在于不知道自己不知道,却以为自己知道,直觉失效就是属于此类,它会引导我们误入歧途。好在这些直觉失效的问题以及解决方案都有迹可循,极客时间我的专栏《Java并发编程实战》相对全面地解释了这些问题以及方案,如果你感兴趣,可以参考一下。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-04-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 京东技术 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Tech
    • 06 总结
    相关产品与服务
    云数据库 Redis
    腾讯云数据库 Redis(TencentDB for Redis)是腾讯云打造的兼容 Redis 协议的缓存和存储服务。丰富的数据结构能帮助您完成不同类型的业务场景开发。支持主从热备,提供自动容灾切换、数据备份、故障迁移、实例监控、在线扩容、数据回档等全套的数据库服务。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档