前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >高并发下的 AtomicLong 性能有点差!

高并发下的 AtomicLong 性能有点差!

作者头像
程序员小强
发布2019-06-02 13:32:34
1.3K0
发布2019-06-02 13:32:34
举报
文章被收录于专栏:小强的进阶之路

如果让你实现一个计数器,有点经验的同学可以很快的想到使用AtomicInteger或者AtomicLong进行简单的封装。

因为计数器操作涉及到内存的可见性和线程之间的竞争,而Atomic*的实现完美的屏蔽了这些技术细节,我们只需要执行相应的方法,就能实现对应的业务需求。

Atomic**虽然好用,不过这些的操作在并发量很大的情况下,性能问题也会被相应的放大。我们可以先看下其中 getAndIncrement的实现代码

代码语言:javascript
复制
public final long getAndIncrement() {    return unsafe.getAndAddLong(this, valueOffset, 1L);}
// unsafe类中的实现public final long getAndAddLong(Object var1, long var2, long var4) {    long var6;    do {        var6 = this.getLongVolatile(var1, var2);    } while(!this.compareAndSwapLong(var1, var2, var6, var6 + var4));
    return var6;}

很显然,在 getAndAddLong实现中,为了实现正确的累加操作,如果并发量很大的话,cpu会花费大量的时间在试错上面,相当于一个spin的操作。如果并发量小的情况,这些消耗可以忽略不计。

既然已经意识到Atomic*有这样的缺陷,Doug Lea大神又给我们提供了LongAdder,内部的实现有点类似ConcurrentHashMap的分段锁,最好的情况下,每个线程都有独立的计数器,这样可以大量减少并发操作。

下面通过JMH比较一下AtomicLong 和 LongAdder的性能。

代码语言:javascript
复制
@OutputTimeUnit(TimeUnit.MICROSECONDS)@BenchmarkMode(Mode.Throughput)public class Main {
    private static AtomicLong count = new AtomicLong();    private static LongAdder longAdder = new LongAdder();    public static void main(String[] args) throws Exception {        Options options = new OptionsBuilder().include(Main.class.getName()).forks(1).build();        new Runner(options).run();    }
    @Benchmark    @Threads(10)    public void run0(){        count.getAndIncrement();    }
    @Benchmark    @Threads(10)    public void run1(){        longAdder.increment();    }}

1、设置BenchmarkMode为Mode.Throughput,测试吞吐量 2、设置BenchmarkMode为Mode.AverageTime,测试平均耗时

线程数为1

1、吞吐量

代码语言:javascript
复制
Benchmark   Mode  Cnt    Score   Error   UnitsMain.run0  thrpt    5  154.525 ± 9.767  ops/usMain.run1  thrpt    5   89.599 ± 7.951  ops/us

2、平均耗时

代码语言:javascript
复制
Benchmark  Mode  Cnt  Score    Error  UnitsMain.run0  avgt    5  0.007 ±  0.001  us/opMain.run1  avgt    5  0.011 ±  0.001  us/op

单线程情况下:1、AtomicLong的吞吐量和平均耗时都占优势

线程数为10

1、吞吐量

代码语言:javascript
复制
Benchmark   Mode  Cnt    Score     Error   UnitsMain.run0  thrpt    5   37.780 ±   1.891  ops/usMain.run1  thrpt    5  464.927 ± 143.207  ops/us

2、平均耗时

代码语言:javascript
复制
Benchmark  Mode  Cnt  Score   Error  UnitsMain.run0  avgt    5  0.290 ± 0.038  us/opMain.run1  avgt    5  0.021 ± 0.001  us/op

并发线程为10个时:

  • LongAdder的吞吐量比较大,是AtomicLong的10倍多。
  • LongAdder的平均耗时是AtomicLong的十分之一。

线程数为30

1、吞吐量

代码语言:javascript
复制
Benchmark   Mode  Cnt    Score    Error   UnitsMain.run0  thrpt    5   36.215 ±  2.341  ops/usMain.run1  thrpt    5  486.630 ± 26.894  ops/us

2、平均耗时

代码语言:javascript
复制
Main.run0  avgt    5  0.792 ± 0.021  us/opMain.run1  avgt    5  0.063 ± 0.002  us/op

线程数为30个时:

  • LongAdder的吞吐量比较大,也是AtomicLong的10倍多。
  • LongAdder的平均耗时也是AtomicLong的十分之一。

总结

一些高并发的场景,比如限流计数器,建议使用LongAdder替换AtomicLong,性能可以提升不少。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-04-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MoziInnovations 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档