专栏首页JavaEdge看完这篇CopyOnWriteArrayList源码解析,和阿里面试官扯了整整一个小时!

看完这篇CopyOnWriteArrayList源码解析,和阿里面试官扯了整整一个小时!

我不停奔跑只为追赶当年被寄予厚望的自己。 ——利文斯顿

0 前言

我们知道 ArrayList 非线程安全,需要自己加锁或者使用 Collections.synchronizedList 包装. 从JDK1.5开始JUC里提供了使用 CopyOnWrite 机制实现的并发容器线程安全的 List - CopyOnWriteArrayList,简称 COW

1 CopyOnWrite 设计思想

1.1 基本概念

CopyOnWrite 写时复制. 一般来说就是当我们往一个容器添加元素的时候,不直接往当前容器添加,而是先将当前容器复制出一个新的容器,往新的容器里添加元素,添加完元素之后,再将原容器引用指向新容器. 即一开始大家都在共享同一内容,当有人想修改该内容时,才会真地把内容copy出去形成一个新的内容然后再改,这是一种延时懒惰策略.

1.2 设计优点

可并发读 CopyOnWrite 容器,而无需加锁,因为当前容器不会添加任何元素. 所以这也是一种读写分离的思想,读写的是不同的容器.

2 继承体系

  • 和 ArrayList 的继承体系类似

3 属性

  • 保护所有更改器的锁
  • 仅能通过getArray / setArray访问的数组
  • lock 内存偏移量

4 构造方法

4.1 无参

  • 创建一个空 list

4.2 有参

  • 创建一个列表,该列表包含指定集合的元素,其顺序由集合的迭代器返回。
  • 创建一个保存给定数组副本的列表

下面开始看源码,到底是如何实现写时复制的.

5 add(E e)

向 COW 里添加元素,是需要加锁的,否则并发写时 copy 出N个副本!

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

public boolean add(E e) { final ReentrantLock lock = this.lock; // 1.加锁 lock.lock(); try { // 得到原数组 Object[] elements = getArray(); int len = elements.length; // 2.复制出新数组,加一是因为要添加yi'ge'yuan's Object[] newElements = Arrays.copyOf(elements, len + 1); // 把新元素添加到新数组里,直接放在数组尾部 newElements[len] = e; // 把原数组引用指向新数组 setArray(newElements); return true; } finally { // finally 里面释放锁,保证即使 try 发生了异常,仍然能够释放锁 lock.unlock(); } }

getArray

  • 获取数组.非priavte,以便也可以从CopyOnWriteArraySet类(直接组合了CopyOnWriteArrayList作为成员变量)访问

setArray

  • 将引用设置到新数组

都加锁,为什么还需要拷贝数组,而不直接在原数组修改?

  • volatile 修饰的是数组引用!简单的在原来数组修改几个元素的值,这种操作是无法发挥可见性的,必须通过修改数组内存地址
  • 在新数组上执行 copyOf,对原数组无任何影响,只有新数组完全拷贝完成之后,外部才能访问,避免了原数组数据变动可能造成的不良影响

6 get

get(int index)

  • 读指定位置元素

get(Object[] a, int index)

读时无需加锁,如果读时其它线程正在向ArrayList添加数据,读还是只会读到旧数据,因为写时并不会锁住旧的数组.

7 remove

7.1 指定索引删除

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

public E remove(int index) { final ReentrantLock lock = this.lock; // 加锁 lock.lock(); try { Object[] elements = getArray(); int len = elements.length; // 先得到旧值 E oldValue = get(elements, index); int numMoved = len - index - 1; // 如果要删除的数据正好是数组的尾部,直接删除 if (numMoved == 0) setArray(Arrays.copyOf(elements, len - 1)); else { // 若删除的数据在数组中间: // 1. 设置新数组的长度减一,因为是减少一个元素 // 2. 从 0 拷贝到数组新位置 // 3. 从新位置拷贝到数组尾部 Object[] newElements = new Object[len - 1]; System.arraycopy(elements, 0, newElements, 0, index); System.arraycopy(elements, index + 1, newElements, index, numMoved); setArray(newElements); } return oldValue; } finally { lock.unlock(); } }

依旧三板斧:

  1. 加锁
  2. 根据删除索引的位置,进行不同策略拷贝
  3. 解锁

7.2 批量删除

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

public boolean removeAll(Collection<?> c) { if (c == null) throw new NullPointerException(); final ReentrantLock lock = this.lock; lock.lock(); try { Object[] elements = getArray(); int len = elements.length; if (len != 0) { // newlen 表新数组的索引位置,新数组中存在不包含在 c 中的元素 int newlen = 0; Object[] temp = new Object[len]; // 循环,把不包含在 c 里面的元素,放到新数组中 for (int i = 0; i < len; ++i) { Object element = elements[i]; // 不包含在 c 中的元素,从 0 开始放到新数组中 if (!c.contains(element)) temp[newlen++] = element; } // 拷贝新数组,变相的删除了不包含在 c 中的元素 if (newlen != len) { setArray(Arrays.copyOf(temp, newlen)); return true; } } return false; } finally { lock.unlock(); } }

并非直接对数组元素逐个删除,而先对数组值循环判断,将无需删除的数据放到临时数组,最后临时数组中的数据就是我们不需要删除的数据.

8 总结

CopyOnWrite 并发容器适用于读多写少的并发场景.CopyOnWrite容器有很多优点,但同时也存在问题,开发时候需要注意:

内存占用问题

写时,内存里会同时驻存两个对象的内存,旧对象和新写入对象(复制的时候只是复制容器里的引用,只是在写的时候会创建新对象添加到新容器里,而旧容器的对象还在使用,所以有两份对象内存).若这些对象占用内存较大,很可能造成频繁GC,应用响应时间也变长. 针对该问题,可通过压缩容器中元素,减少大对象的内存,或者直接不使用CopyOnWrite容器,而使用其他并发容器,如ConcurrentHashMap。

数据一致性问题

CopyOnWrite容器只能保证数据的最终一致性,不能保证数据的实时一致性,请酌情使用.

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 啃透JDK源码系列-Arrays核心源码解析

    此类包含用于操纵数组的各种方法(例如排序和搜索)。 此类还包含一个静态工厂,该工厂允许将数组视为列表。 如果指定的数组引用为null,则除非另有说明,否则此类...

    JavaEdge
  • CopyOnWriteArrayList 源码解析

    我们知道 ArrayList 非线程安全,需要自己加锁或者使用 Collections.synchronizedList 包装.

    JavaEdge
  • Java并发编程实战系列5之基础构建模块

    1 同步容器类 同步容器类包括Vector和HashTable,二者是早期JDK一部分,此外还包括在JDK 1.2中添加的一些功能相似的类,这些的同步封装器类是...

    JavaEdge
  • 2018-07-02Python数组

    用户1733354
  • JS框架设计之对象数组化一种子模块

    类数组对象是一个很好的存储结构,但是功能太弱了,为了享受纯数组的哪些便捷的方法,使用前可以做下转换,通常可以使用$.slice.call()方法做转换,但是旧版...

    郑小超.
  • 初探numpy——numpy常用通用函数

    快速的逐元素数组函数,也可以称为ufunc,对ndarray数据中的元素进行逐元素操作的函数

    LRainner
  • 硅谷移动医疗有多牛?

    大数据文摘
  • solidity定长数组和动态数组

    其中第二种情况未声明数组内容时,可通过直接通过push向数组中添加值,或初始化一个数组然后再赋值。

    程序新视界
  • 常见的集合容器应当避免的坑

    前不久帮同事一起 review 一个 job 执行缓慢的问题时发现不少朋友在撸码实现功能时还是有需要细节不够注意,于是便有了这篇文章。

    周萝卜
  • 大量数据写入时,初始化指定ArrayList长度

    其实在大部分情况下这都是没啥问题,无非就是循环的往 ArrayList 中写入数据而已。

    chenchenchen

扫码关注云+社区

领取腾讯云代金券