前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Java容器(List、Set、Map)知识点快速复习手册(上)

Java容器(List、Set、Map)知识点快速复习手册(上)

作者头像
Rude3Knife的公众号
发布2019-08-07 11:30:40
4300
发布2019-08-07 11:30:40
举报
文章被收录于专栏:后端技术漫谈

前言

本文快速回顾了Java中容器的知识点,用作面试复习,事半功倍。

上篇:主要为容器概览,容器中用到的设计模式,List源码

中篇:Map源码

下篇:Set源码,容器总结

其它知识点复习手册

概览

容器主要包括 Collection 和 Map 两种,Collection 又包含了 List、Set 以及 Queue。

Collection

数组和集合的区别:

  • 长度
    • 数组的长度固定
    • 集合的长度可变
  • 内容
    • 数组存储的是同一种类型的元素
    • 集合可以存储不同类型的元素(但是一般我们不这样干..)
  • 元素的数据类型
    • 数组可以存储基本数据类型,也可以存储引用类型
    • 集合只能存储引用类型(若存储的是简单的int,它会自动装箱成Integer)

1. Set(元素不可重复)

  • HashSet:基于HashMap实现,支持快速查找,但不支持有序性操作
  • TreeSet:基于红黑树实现,支持有序性操作,但是查找效率不如 HashSet,HashSet 查找时间复杂度为 O(1),TreeSet 则为 O(logN);
  • LinkedHashSet:具有 HashSet 的查找效率,且内部使用链表维护元素的插入顺序

2. List(有序(存储顺序和取出顺序一致),可重复)

  • ArrayList:基于动态数组实现,支持随机访问;
  • Vector:和 ArrayList 类似,但它是线程安全的;
  • LinkedList:基于双向链表实现,只能顺序访问,但是可以快速地在链表中间插入和删除元素。不仅如此,LinkedList 还可以用作栈、队列和双向队列。

3. Queue

  • LinkedList:可以用它来支持双向队列;
  • PriorityQueue:基于堆结构实现,可以用它来实现优先队列。

Map

  • HashMap:基于哈希实现;
  • HashTable:和 HashMap 类似,但它是线程安全的,这意味着同一时刻多个线程可以同时写入 HashTable 并且不会导致数据不一致。它是遗留类,不应该去使用它
  • ConcurrentHashMap:支持线程安全,并且 ConcurrentHashMap 的效率会更高,因为 ConcurrentHashMap 引入了分段锁。
  • LinkedHashMap:使用链表来维护元素的顺序,顺序为插入顺序或者最近最少使用(LRU)顺序。
  • TreeMap:基于红黑树实现。

Fail-Fast 机制和 Fail-Safe 机制

https://blog.csdn.net/Kato_op/article/details/80356618

Fail-Fast

Fail-fast 机制是 java 集合(Collection)中的一种错误机制。 当多个线程对同一个集合的内容进行操作时,就可能会产生 fail-fast 事件。

  • 迭代器在遍历时直接访问集合中的内容,并且在遍历过程中使用一个modCount变量,
  • 集合中在被遍历期间如果内容发生变化(增删改),就会改变modCount的值,
  • 每当迭代器使用 hashNext()/next()遍历下一个元素之前,都会执行checkForComodification()方法检测,modCount变量和expectedmodCount值是否相等,
  • 如果相等就返回遍历,否则抛出异常,终止遍历.

注意,如果集合发生变化时修改modCount值, 刚好有设置为了expectedmodCount值, 则异常不会抛出.(比如删除了数据,再添加一条数据)

所以,一般来说,存在非同步的并发修改时,不可能作出任何坚决的保证。

迭代器的快速失败行为应该仅用于检测程序错误, 而不是用他来同步。

java.util包下的集合类都是Fail-Fast机制的,不能在多线程下发生并发修改(迭代过程中被修改).

Fail-Safe

采用安全失败(Fail-Safe)机制的集合容器,在遍历时不是直接在集合内容上访问的,而是先copy原有集合内容,在拷贝的集合上进行遍历

原理:

由于迭代时是对原集合的拷贝的值进行遍历,所以在遍历过程中对原集合所作的修改并不能被迭代器检测到,所以不会出发ConcurrentModificationException

缺点:

迭代器并不能访问到修改后的内容(简单来说就是, 迭代器遍历的是开始遍历那一刻拿到的集合拷贝,在遍历期间原集合发生的修改迭代器是不知道的)

使用场景:

java.util.concurrent包下的容器都是Fail-Safe的,可以在多线程下并发使用,并发修改

容器中使用的设计模式

迭代器模式

  • Iterator它是在ArrayList等集合的内部类的方式实现

Collection 实现了 Iterable 接口,其中的 iterator() 方法能够产生一个 Iterator 对象,通过这个对象就可以迭代遍历 Collection 中的元素。

从 JDK 1.5 之后可以使用 foreach 方法来遍历实现了 Iterable 接口的聚合对象。

代码语言:javascript
复制
List<String> list = new ArrayList<>();
list.add("a");
list.add("b");
for (String item : list) {
    System.out.println(item);
}

适配器模式

适配器模式解释:https://www.jianshu.com/p/93821721bf08

java.util.Arrays#asList() 可以把数组类型转换为 List 类型。

代码语言:javascript
复制
@SafeVarargs
public static <T> List<T> asList(T... a)

如果要将数组类型转换为 List 类型,应该注意的是 asList() 的参数为泛型的变长参数,因此不能使用基本类型数组作为参数,只能使用相应的包装类型数组。

代码语言:javascript
复制
Integer[] arr = {1, 2, 3};
List list = Arrays.asList(arr);

也可以使用以下方式生成 List。

代码语言:javascript
复制
List list = Arrays.asList(1,2,3);

源码分析

ArrayList

关键词

  • 默认大小为 10
  • 扩容 1.5 倍,加载因子为 0.5
  • 基于动态数组实现
  • 删除元素时不会减少容量,若希望减少容量则调用trimToSize()
  • 它不是线程安全的
  • 它能存放null值。
  • 扩容操作需要调用 Arrays.copyOf() 把原数组整个复制到新数组
  • 删除需要调用 System.arraycopy() 将 index+1 后面的元素都复制到 index 位置上,复制的代价很高。 -序列化:只序列化数组中有元素填充那部分内容

概览

实现了 RandomAccess 接口,因此支持随机访问。这是理所当然的,因为 ArrayList 是基于数组实现的。

代码语言:javascript
复制
public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable

扩容

如果不够时,需要使用 grow() 方法进行扩容,新容量的大小为 oldCapacity+(oldCapacity>>1),也就是旧容量的 1.5 倍。

扩容操作需要调用 Arrays.copyOf() 把原数组整个复制到新数组

因此最好在创建 ArrayList 对象时就指定大概的容量大小,减少扩容操作的次数。

代码语言:javascript
复制
public boolean add(E e) {
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    elementData[size++] = e;
    return true;
}

private void ensureCapacityInternal(int minCapacity) {
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    ensureExplicitCapacity(minCapacity);
}

private void ensureExplicitCapacity(int minCapacity) {
    modCount++;
    // overflow-conscious code
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);
}

private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // minCapacity is usually close to size, so this is a win:
    elementData = Arrays.copyOf(elementData, newCapacity);
}

加入元素:add

add(E e)

首先去检查一下数组的容量是否足够

  • 足够:直接添加
  • 不足够:扩容

扩容到原来的1.5倍,第一次扩容后,如果容量还是小于minCapacity,就将容量扩充为minCapacity。

add(int index, E element)

步骤:

  • 检查角标
  • 空间检查,如果有需要进行扩容
  • 插入元素

删除元素:remove

步骤:

  • 检查角标
  • 删除元素
  • 计算出需要移动的个数,并移动
  • 设置为null,让GC回收(所以说不是立刻回收,而是等待GC回收)
代码语言:javascript
复制
public E remove(int index) {
    rangeCheck(index);
    modCount++;
    E oldValue = elementData(index);
    int numMoved = size - index - 1;
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index, numMoved);
    elementData[--size] = null; // clear to let GC do its work
    return oldValue;
}

需要调用 System.arraycopy() 将 index+1 后面的元素都复制到 index 位置上,复制的代价很高。

复制数组:System.arraycopy()

看到arraycopy(),我们可以发现:该方法是由C/C++来编写的

Fail-Fast

modCount 用来记录 ArrayList 结构发生变化的次数。结构发生变化是指添加或者删除至少一个元素的所有操作,或者是调整内部数组的大小,仅仅只是设置元素的值不算结构发生变化。

在进行序列化或者迭代等操作时,需要比较操作前后 modCount 是否改变,如果改变了需要抛出 ConcurrentModificationException。

代码语言:javascript
复制
private void writeObject(java.io.ObjectOutputStream s)
    throws java.io.IOException{
    // Write out element count, and any hidden stuff
    int expectedModCount = modCount;
    s.defaultWriteObject();

    // Write out size as capacity for behavioural compatibility with clone()
    s.writeInt(size);

    // Write out all elements in the proper order.
    for (int i=0; i<size; i++) {
        s.writeObject(elementData[i]);
    }

    if (modCount != expectedModCount) {
        throw new ConcurrentModificationException();
    }
}

构造器

ArrayList 提供了三种方式的构造器:

  • public ArrayList()可以构造一个默认初始容量为10的空列表;
  • public ArrayList(int initialCapacity)构造一个指定初始容量的空列表;
  • public ArrayList(Collection c)构造一个包含指定 collection 的元素的列表,这些元素按照该collection的迭代器返回它们的顺序排列的。

序列化

补充:transient讲解

http://www.importnew.com/21517.html

你只需要实现Serilizable接口,将不需要序列化的属性前添加关键字transient,序列化对象的时候,这个属性就不会序列化到指定的目的地中。

ArrayList 基于数组实现,并且具有动态扩容特性,因此保存元素的数组不一定都会被使用,那么就没必要全部进行序列化。

保存元素的数组 elementData 使用 transient 修饰,该关键字声明数组默认不会被序列化

代码语言:javascript
复制
transient Object[] elementData; // non-private to simplify nested class access

ArrayList 实现了 writeObject() 和 readObject() 来控制只序列化数组中有元素填充那部分内容

代码语言:javascript
复制
private void readObject(java.io.ObjectInputStream s)
    throws java.io.IOException, ClassNotFoundException {
    elementData = EMPTY_ELEMENTDATA;

    // Read in size, and any hidden stuff
    s.defaultReadObject();

    // Read in capacity
    s.readInt(); // ignored

    if (size > 0) {
        // be like clone(), allocate array based upon size not capacity
        ensureCapacityInternal(size);

        Object[] a = elementData;
        // Read in all elements in the proper order.
        for (int i=0; i<size; i++) {
            a[i] = s.readObject();
        }
    }
}
代码语言:javascript
复制
private void writeObject(java.io.ObjectOutputStream s)
    throws java.io.IOException{
    // Write out element count, and any hidden stuff
    int expectedModCount = modCount;
    s.defaultWriteObject();

    // Write out size as capacity for behavioural compatibility with clone()
    s.writeInt(size);

    // Write out all elements in the proper order.
    for (int i=0; i<size; i++) {
        s.writeObject(elementData[i]);
    }

    if (modCount != expectedModCount) {
        throw new ConcurrentModificationException();
    }
}

序列化时需要使用 ObjectOutputStream 的 writeObject() 将对象转换为字节流并输出。而 writeObject() 方法在传入的对象存在 writeObject() 的时候会去反射调用该对象的 writeObject() 来实现序列化。反序列化使用的是 ObjectInputStream 的 readObject() 方法,原理类似。

代码语言:javascript
复制
ArrayList list = new ArrayList();
ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream(file));
oos.writeObject(list);

Vector

关键词

  • 默认大小为 10(与Arraylist相同)
  • 扩容 2 倍,加载因子是 1(Arraylist是扩容 1.5 倍,加载因子为 0.5)
  • 其它几乎与ArrayList完全相同,唯一的区别在于 Vector 是同步的,因此开销就比 ArrayList 要大,访问速度更慢。
  • 使用了 synchronized 进行同步
  • Vector是jdk1.2的类了,比较老旧的一个集合类。应使用JUC的CopyOnWriteArrayList代替

替代方案

可以使用 Collections.synchronizedList(); 得到一个线程安全的 ArrayList。

代码语言:javascript
复制
List<String> list = new ArrayList<>();
List<String> synList = Collections.synchronizedList(list);

也可以使用 concurrent 并发包下的 CopyOnWriteArrayList 类。

代码语言:javascript
复制
List<String> list = new CopyOnWriteArrayList<>();

CopyOnWriteArrayList

关键词

  • 写操作在一个复制的数组上进行,读操作还是在原始数组中进行,读写分离,互不影响。
  • 写操作需要加锁,防止并发写入时导致写入数据丢失。
  • 写操作结束之后需要把原始数组指向新的复制数组。
  • 适用于读操作远大于写操作的场景。

读写分离

代码语言:javascript
复制
public boolean add(E e) {
    final ReentrantLock lock = this.lock;
    lock.lock();
    try {
        Object[] elements = getArray();
        int len = elements.length;
        Object[] newElements = Arrays.copyOf(elements, len + 1);
        newElements[len] = e;
        setArray(newElements);
        return true;
    } finally {
        lock.unlock();
    }
}

final void setArray(Object[] a) {
    array = a;
}
代码语言:javascript
复制
@SuppressWarnings("unchecked")
private E get(Object[] a, int index) {
    return (E) a[index];
}

适用场景

CopyOnWriteArrayList 在写操作的同时允许读操作,大大提高了读操作的性能,因此很适合读多写少的应用场景。

缺陷

  • 内存占用:在写操作时需要复制一个新的数组,使得内存占用为原来的两倍左右;
  • 数据不一致:读操作不能读取实时性的数据,因为部分写操作的数据还未同步到读数组中

所以 CopyOnWriteArrayList 不适合内存敏感以及对实时性要求很高的场景。

LinkedList

关键词

  • 双向链表
  • 默认大小为 10
  • 带 Head 和 Tail 指针
  • Node 存储节点信息

概览

基于双向链表实现,内部使用 Node 来存储链表节点信息。

代码语言:javascript
复制
private static class Node<E> {
    E item;
    Node<E> next;
    Node<E> prev;
}

每个链表存储了 Head 和 Tail 指针:

代码语言:javascript
复制
transient Node<E> first;
transient Node<E> last;

ArrayList 与 LinkedList 比较

  • ArrayList 基于动态数组实现,LinkedList 基于双向链表实现;
  • ArrayList 支持随机访问,LinkedList 不支持;
  • LinkedList 在任意位置添加删除元素更快。

删除元素:remove

获取元素:get

  • 下标小于长度的一半,从头遍历
  • 反之,从尾部遍历

替换元素:set

set方法和get方法其实差不多,根据下标来判断是从头遍历还是从尾遍历

其他方法

LinkedList实现了Deque接口,因此,我们可以操作LinkedList像操作队列和栈一样

LinkedList的方法比ArrayList的方法多太多了,这里我就不一一说明了。具体可参考:

  • https://blog.csdn.net/panweiwei1994/article/details/77110354
  • https://zhuanlan.zhihu.com/p/24730576
  • https://zhuanlan.zhihu.com/p/28373321

参考

  • https://github.com/CyC2018/CS-Notes/blob/master/docs/notes/Java%20%E5%AE%B9%E5%99%A8.md
  • Eckel B. Java 编程思想 [M]. 机械工业出版社, 2002.
  • Java Collection Framework
  • Iterator 模式
  • Java 8 系列之重新认识 HashMap
  • What is difference between HashMap and Hashtable in Java?
  • Java 集合之 HashMap
  • The principle of ConcurrentHashMap analysis
  • 探索 ConcurrentHashMap 高并发性的实现机制
  • HashMap 相关面试题及其解答
  • Java 集合细节(二):asList 的缺陷
  • Java Collection Framework – The LinkedList Class

关注我

本人目前为后台开发工程师,主要关注Python爬虫,后台开发等相关技术。

原创博客主要内容:

  • 笔试面试复习知识点手册
  • Leetcode算法题解析(前150题)
  • 剑指offer算法题解析
  • Python爬虫相关实战
  • 后台开发相关实战

同步更新以下几大博客:

  • Csdn:

http://blog.csdn.net/qqxx6661

拥有专栏:Leetcode题解(Java/Python)、Python爬虫开发

  • 知乎:

https://www.zhihu.com/people/yang-zhen-dong-1/

拥有专栏:码农面试助攻手册

  • 掘金:

https://juejin.im/user/5b48015ce51d45191462ba55

  • 简书:

https://www.jianshu.com/u/b5f225ca2376

  • 个人公众号:Rude3Knife
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-01-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 后端技术漫谈 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 其它知识点复习手册
  • 概览
    • Collection
      • 1. Set(元素不可重复)
      • 2. List(有序(存储顺序和取出顺序一致),可重复)
      • 3. Queue
    • Map
      • Fail-Fast 机制和 Fail-Safe 机制
        • Fail-Fast
        • Fail-Safe
    • 容器中使用的设计模式
      • 迭代器模式
        • 适配器模式
        • 源码分析
          • ArrayList
            • 关键词
            • 概览
            • 扩容
            • 加入元素:add
            • 删除元素:remove
            • 复制数组:System.arraycopy()
            • Fail-Fast
            • 构造器
            • 序列化
          • Vector
            • 关键词
            • 替代方案
          • CopyOnWriteArrayList
            • 关键词
            • 读写分离
            • 适用场景
            • 缺陷
          • LinkedList
            • 关键词
            • 概览
            • ArrayList 与 LinkedList 比较
            • 删除元素:remove
            • 获取元素:get
            • 替换元素:set
            • 其他方法
        • 参考
        • 关注我
        相关产品与服务
        文件存储
        文件存储(Cloud File Storage,CFS)为您提供安全可靠、可扩展的共享文件存储服务。文件存储可与腾讯云服务器、容器服务、批量计算等服务搭配使用,为多个计算节点提供容量和性能可弹性扩展的高性能共享存储。腾讯云文件存储的管理界面简单、易使用,可实现对现有应用的无缝集成;按实际用量付费,为您节约成本,简化 IT 运维工作。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档