map是一个接口,是一个映射着key和value关系的容器,从定义上看,map不能包含重复的key,一个key最多只能映射一个value。map是否有序取决于它的实现类,treeMap是有序的,hashmap是无序的。
对于map不支持的操作,会报UnsupportedOperationException
。
map接口不会限制key和value是否可以为null
,不会限制一定用equals
or hashCode
判断key是否相等,这都取决于具体的实现类。
map有get(Object key)
,put(key, value)
,replace(key, value)
,remove(key)
,entrySet()
,keySet()
等方法。都是通过key来查找,替换value。
Hashtable继承Dictionary,实现Map接口,是一个不推荐使用的Map实现类。Dictionary是1.2推出,用于存键值对的抽象类,已经废弃。
Hashtable的数据结构是数组加链表,它是并发安全的。下面说说它的数据结构与get(key)
,put(key, value)
,remove(key)
,keySet()
都是如何实现的。
数据结构:Hashtable
的数据结构实际是数组加链表,即使用数组存储,数组的每个item都是一个链表对象。之所以这么设计的原因是Object采用(key.hashcode & 0x7FFFFFFF) % tab.length
来定位Object存放下标,但是两个对象的hashCode可能相同,两个不同hashCode& 0x7FFFFFFF也可能相同,取余也可能会相同,对于index相同key,就采用链表的方式去存了。
private transient Entry<?,?>[] table;
private static class Entry<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Entry<K,V> next;
}
既然hashTable存的是数组,那就肯定要涉及到数组的初始化长度和扩容策略了。hashTable数组默认长度是11,扩容阀值是0.75,每次扩容长度为length*2+1。即当hashTable中的元素数达到table.length*阀值(0.75)时,就会触发扩容,它会创建一个新的数组,长度为length*2+1,并对所有元素进行重新定位。扩容机制发生在put方法,所以put(value)方法效率可能会很慢(发生扩容)。
// hashTable会默认加载一个长度为11的数组
public Hashtable() {
this(11, 0.75f);
}
public Hashtable(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal Load: "+loadFactor);
if (initialCapacity==0)
initialCapacity = 1;
this.loadFactor = loadFactor;
table = new Entry<?,?>[initialCapacity];
threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
}
put方法:通过(key.hashcode & 0x7FFFFFFF) % tab.length
来定位数组下标,获下标对于链表,通过key.equals
判断可以相同的对象,将key,value放入新Entry对象并替换原对象并跳出方法;进入添加元素方法,判断元素长度是否超过阀值,定位到数组index,构造新Entry对象并插入到链表头节点。
插入链表头节点是最简单的操作,e.next = (Entry<K,V>)newMap[index]; newMap[index] = e;
public synchronized V put(K key, V value) {
// Make sure the value is not null
if (value == null) {
throw new NullPointerException();
}
// Makes sure the key is not already in the hashtable.
Entry<?,?> tab[] = table;
// key不可为null
int hash = key.hashCode();
// 获得一个小于int最大值的数,0x7FFFFFFF int最大值
int index = (hash & 0x7FFFFFFF) % tab.length;
@SuppressWarnings("unchecked")
Entry<K,V> entry = (Entry<K,V>)tab[index];
for(; entry != null ; entry = entry.next) {
if ((entry.hash == hash) && entry.key.equals(key)) {
V old = entry.value;
entry.value = value;
return old;
}
}
addEntry(hash, key, value, index);
return null;
}
private void addEntry(int hash, K key, V value, int index) {
modCount++;
Entry<?,?> tab[] = table;
if (count >= threshold) {
// 扩容并重新hash定位
rehash();
tab = table;
hash = key.hashCode();
index = (hash & 0x7FFFFFFF) % tab.length;
}
@SuppressWarnings("unchecked")
Entry<K,V> e = (Entry<K,V>) tab[index];
tab[index] = new Entry<>(hash, key, value, e);
count++;
}
protected void rehash() {
int oldCapacity = table.length;
Entry<?,?>[] oldMap = table;
// 扩容
int newCapacity = (oldCapacity << 1) + 1;
if (newCapacity - MAX_ARRAY_SIZE > 0) {
if (oldCapacity == MAX_ARRAY_SIZE)
// Keep running with MAX_ARRAY_SIZE buckets
return;
newCapacity = MAX_ARRAY_SIZE;
}
Entry<?,?>[] newMap = new Entry<?,?>[newCapacity];
modCount++;
threshold = (int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
table = newMap;
for (int i = oldCapacity ; i-- > 0 ;) {
for (Entry<K,V> old = (Entry<K,V>)oldMap[i] ; old != null ; ) {
Entry<K,V> e = old;
old = old.next;
int index = (e.hash & 0x7FFFFFFF) % newCapacity;
e.next = (Entry<K,V>)newMap[index];
newMap[index] = e;
}
}
}
get(key)的实现逻辑是通过hash找到数组index,在遍历index对应的链表,通过equals判读相同的key。
public synchronized V get(Object key) {
Entry<?,?> tab[] = table;
int hash = key.hashCode();
int index = (hash & 0x7FFFFFFF) % tab.length;
for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) {
if ((e.hash == hash) && e.key.equals(key)) {
return (V)e.value;
}
}
return null;
}
remove(key)实现也很简单,通过hash找到数组index,在遍历这个链表,找到equals的key,接着把上一个节点的指针指向要删除节点的next,对象赋空。
public synchronized V remove(Object key) {
Entry<?,?> tab[] = table;
int hash = key.hashCode();
int index = (hash & 0x7FFFFFFF) % tab.length;
@SuppressWarnings("unchecked")
Entry<K,V> e = (Entry<K,V>)tab[index];
for(Entry<K,V> prev = null ; e != null ; prev = e, e = e.next) {
if ((e.hash == hash) && e.key.equals(key)) {
modCount++;
if (prev != null) {
prev.next = e.next;
} else {
tab[index] = e.next;
}
count--;
V oldValue = e.value;
e.value = null;
return oldValue;
}
}
return null;
}
keySet()是获所有的key,对map进行迭代的一个处理。HashTable的keySet是这么做处理的。HashTable自己显现了一个keySet类,但它只是一个空架子,真正的实现在迭代器方法中,而迭代器返回的是HashTable实现的一个内部类Enumerator。实现和运行逻辑是
private class Enumerator<T> implements Enumeration<T>, Iterator<T> {
// map的数组
Entry<?,?>[] table = Hashtable.this.table;
// 迭代到哪一个下标
int index = table.length;
// 目前迭代的对象
Entry<?,?> entry;
// 上次返回的对象
Entry<?,?> lastReturned;
// 迭代key还是value
int type;
boolean iterator;
protected int expectedModCount = modCount;
Enumerator(int type, boolean iterator) {
this.type = type;
this.iterator = iterator;
}
//1.判断当前元素是否有next,2.在数组中index到0去遍历,如果都是null,则没有下个元素。
public boolean hasMoreElements() {
Entry<?,?> e = entry;
int i = index;
Entry<?,?>[] t = table;
/* Use locals for faster loop iteration */
while (e == null && i > 0) {
e = t[--i];
}
entry = e;
index = i;
return e != null;
}
// 当前返回entry不为空时,直接返回entry,并把entry赋值成next;数组倒叙遍历到不是null的,把这个node赋值给entry,赋值数组下标,返回entry,并把entry赋值成next
@SuppressWarnings("unchecked")
public T nextElement() {
Entry<?,?> et = entry;
int i = index;
Entry<?,?>[] t = table;
/* Use locals for faster loop iteration */
while (et == null && i > 0) {
et = t[--i];
}
entry = et;
index = i;
if (et != null) {
Entry<?,?> e = lastReturned = entry;
entry = e.next;
return type == KEYS ? (T)e.key : (type == VALUES ? (T)e.value : (T)e);
}
throw new NoSuchElementException("Hashtable Enumerator");
}
public boolean hasNext() {
return hasMoreElements();
}
public T next() {
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
return nextElement();
}
}
HashTable是线程安全的,原因是在每个方法前都加上了synchronized,故而它最多支持一个线程操作。