ConcurrentHashMap使用示例

作者:mononite

链接:https://my.oschina.net/mononite/blog/144329(点击文末阅读原文前往)

ConcurrentHashMap通常只被看做并发效率更高的Map,用来替换其他线程安全的Map容器,比如Hashtable和Collections.synchronizedMap。实际上,线程安全的容器,特别是Map,应用场景没有想象中的多,很多情况下一个业务会涉及容器的多个操作,即复合操作,并发执行时,线程安全的容器只能保证自身的数据不被破坏,但无法保证业务的行为是否正确。

举个例子:统计文本中单词出现的次数,把单词出现的次数记录到一个Map中,代码如下:

private final Map<String, Long> wordCounts = new ConcurrentHashMap<>();
public long increase(String word) {   
 Long oldValue = wordCounts.get(word);   
 Long newValue = (oldValue == null) ? 1L : oldValue + 1;
 wordCounts.put(word, newValue);    
 return newValue;
}

如果多个线程并发调用这个increase()方法,increase()的实现就是错误的,因为多个线程用相同的word调用时,很可能会覆盖相互的结果,造成记录的次数比实际出现的次数少。

除了用锁解决这个问题,另外一个选择是使用ConcurrentMap接口定义的方法:

public interface ConcurrentMap<K, V> extends Map<K, V> {   
 V putIfAbsent(K key, V value);    
 boolean remove(Object key, Object value);    
 boolean replace(K key, V oldValue, V newValue);    
 V replace(K key, V value);
}

这是个被很多人忽略的接口,也经常见有人错误地使用这个接口。ConcurrentMap接口定义了几个基于CAS(Compare and Set)操作,很简单,但非常有用,下面的代码用ConcurrentMap解决上面问题:

private final ConcurrentMap<String, Long> wordCounts = new ConcurrentHashMap<>();
public long increase(String word) {   
 Long oldValue, newValue;   
  while (true) {
      oldValue = wordCounts.get(word);    
      if (oldValue == null) { 
      // Add the word firstly, initial the value as 1
          newValue = 1L;            
          if (wordCounts.putIfAbsent(word, newValue) == null) { 
               break;
           }
        } else {
           newValue = oldValue + 1;            
           if (wordCounts.replace(word, oldValue, newValue)) {  
               break;
           }
        }
    }    
   return newValue;
}

代码有点复杂,主要因为ConcurrentMap中不能保存value为null的值,所以得同时处理word不存在和已存在两种情况。

上面的实现每次调用都会涉及Long对象的拆箱和装箱操作,很明显,更好的实现方式是采用AtomicLong,下面是采用AtomicLong后的代码:

private final ConcurrentMap<String, AtomicLong> wordCounts = new ConcurrentHashMap<>();
public long increase(String word) {
   AtomicLong number = wordCounts.get(word);   
   if (number == null) {
     AtomicLong newNumber = new AtomicLong(0);       
     number = wordCounts.putIfAbsent(word, newNumber);      
     if (number == null) {       
          number = newNumber;
      }
   }    
    return number.incrementAndGet();
}

这个实现仍然有一处需要说明的地方,如果多个线程同时增加一个目前还不存在的词,那么很可能会产生多个newNumber对象,但最终只有一个newNumber有用,其他的都会被扔掉。对于这个应用,这不算问题,创建AtomicLong的成本不高,而且只在添加不存在词是出现。但换个场景,比如缓存,那么这很可能就是问题了,因为缓存中的对象获取成本一般都比较高,而且通常缓存都会经常失效,那么避免重复创建对象就有价值了。下面的代码演示了怎么处理这种情况:

private final ConcurrentMap<String, Future<ExpensiveObj>> cache = new ConcurrentHashMap<>();
public ExpensiveObj get(final String key) {
    Future<ExpensiveObj> future = cache.get(key); 
    if (future == null) {
        Callable<ExpensiveObj> callable = new Callable<ExpensiveObj>() {
    
          @Override          
          public ExpensiveObj call() throws Exception { 
    
              return new ExpensiveObj(key);
          }
        };
        FutureTask<ExpensiveObj> task = new FutureTask<>(callable);

        future = cache.putIfAbsent(key, task);        
    
         if (future == null) {
            future = task;       
            task.run();
        }
    } 
    
     try {     
        return future.get();
    } catch (Exception e) {
        cache.remove(key);    
    
         throw new RuntimeException(e);
    }
}

解决方法其实就是用一个Proxy对象来包装真正的对象,跟常见的lazy load原理类似;使用FutureTask主要是为了保证同步,避免一个Proxy创建多个对象。注意,上面代码里的异常处理是不准确的。

最后再补充一下,如果真要实现前面说的统计单词次数功能,最合适的方法是Guava包中AtomicLongMap;一般使用ConcurrentHashMap,也尽量使用Guava中的MapMaker或cache实现。

原文发布于微信公众号 - java达人(drjava)

原文发表时间:2017-03-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏小樱的经验随笔

【Java数据结构学习笔记之三】Java数据结构与算法之队列(Queue)实现

  本篇是数据结构与算法的第三篇,本篇我们将来了解一下知识点: 队列的抽象数据类型 顺序队列的设计与实现 链式队列的设计与实现 队列应用的简单举例 优先队列的设...

4047
来自专栏菩提树下的杨过

java一些常用并发工具示例

最近把《java并发编程实战》-Java Consurrency in Practice 重温了一遍,把书中提到的一些常用工具记录于此: 一、闭锁(门栓)- C...

2397
来自专栏noteless

【JAVA集合框架一 】java集合框架官方介绍 Collections Framework Overview 集合框架总览 翻译 javase8 集合官方文档中文版

https://docs.oracle.com/javase/8/docs/technotes/guides/collections/overview.html

842
来自专栏屈定‘s Blog

Java8 Lambda(二)-Stream原理

推荐一篇博文,很好的介绍了Stream的原理.本文对其进行一些补充更加详细的讲解.

5242
来自专栏C语言及其他语言

【每日一题】问题 1209: 密码截获

题目描述 Catcher是MCA国的情报员,他工作时发现敌国会用一些对称的密码 进行通信,比如像这些ABBA,ABA,A,123321,但是他们有时会在开始或...

2757
来自专栏开发与安全

数据结构:队列的顺序存储结构(循环队列)

队列(Queue)是只允许在一端进行插入操作,而在另一端进行删除操作的线性表。是一种先进先出的线性表(FIFO)。允许插入的一端称为队尾,允许删除的一端称为队头...

2387
来自专栏Python小屋

使用Python编写程序求解数独游戏答案

问题描述:数独盘面是个九宫,每一宫又分为九个小格。在这八十一格中给出一定的已知数字和解题条件,利用逻辑和推理,在其他的空格上填入1-9的数字。使1-9每个数字在...

2773
来自专栏Java大联盟

23种设计模式详解(五)

1403
来自专栏xingoo, 一个梦想做发明家的程序员

汇编语言 手记8

栈有两个基本的操作:入栈和出栈 入栈:将一个新的元素放到栈顶 出栈:从栈顶取出一个元素 栈顶的元素总是最后入栈,需要出栈时,又最先被从栈中取出。 栈的操作规则:...

1975
来自专栏一个会写诗的程序员的博客

《Kotlin 程序设计》第十二章 Kotlin的多线程

Kotlin 1.1 introduced coroutines, a new way of writing asynchronous, non-blockin...

1221

扫码关注云+社区

领取腾讯云代金券