多线程环境下如何解决HashMap线程安全的问题?
使用Collections.synchronizedMap(Map)创建线程安全的map集合;
private final Map<K,V> m; final Object mutex;
SynchronizedMap(Map<K,V> m) { this.m = Objects.requireNonNull(m); mutex = this; }
SynchronizedMap(Map<K,V> m, Object mutex) { this.m = m; this.mutex = mutex; }
|
在SynchronizedMap内部维护了一个普通对象Map和排斥锁mutex,并且有两个构造器,如果传入了mutex参数,则将对象排斥锁赋值为传入的对象;如果没有,则将对象排斥锁赋值为this。创建出SynchronizedMap后,再操作map时,会对方法上锁。
public int size() { synchronized (mutex) {return m.size();} } public boolean isEmpty() { synchronized (mutex) {return m.isEmpty();} } public boolean containsKey(Object key) { synchronized (mutex) {return m.containsKey(key);} } public boolean containsValue(Object value) { synchronized (mutex) {return m.containsValue(value);} } public V get(Object key) { synchronized (mutex) {return m.get(key);} }
|
Hashtable
效率低,因为在对数据操作时都会上锁。
与HashMap的区别:
实现方式不同:Hashtable继承了Dictionary类,HashMap继承的是AbstractMap类;
初始化容量不同:HashMap的初始容量为16,Hashtable为11,二者的负载因子默认都是0.75;
扩容机制不同:当现有容量大于总容量*负载因子时,HashMap的扩容规则为当前容量翻倍,Hashtable为当前容量翻倍 + 1;
迭代器不同:HashMap中的Iterator迭代器是fail-fast的,而Hashtable的Enumerator不是fail-fast的;
Hashtable不允许键或值为null,HashMap的键值都可以为null;
原因:Hashtable在put空值时会抛出空指针异常,Hashtable使用的是安全失败机制fail-safe,这种机制会使此次读到的数据不一定是最新的数据。如果使用null值,就会使其无法判断对应的key是不存在还是为空,ConcurrentHashMap同理。
fail-fast:
是Java集合中的一种机制,在用迭代器遍历一个集合对象时,如果遍历过程中对集合对象的内容进行了修改(增加、删除、修改),则会抛出Concurrent Modification Exception。
原理:迭代器在遍历时直接访问集合中的内容,并且在遍历过程中使用一个 modCount 变量。集合在被遍历期间如果内容发生变化,就会改变modCount的值。每当迭代器使用hashNext()/next()遍历下一个元素之前,都会检测modCount变量是否为expectedmodCount值,是的话就返回遍历;否则抛出异常,终止遍历。
使用场景:java.util包下的集合类都是fail-fast的,不能在多线程下并发修改。
fail-safe:
遍历基于容器的一个克隆,对容器内容的修改不影响遍历。java.util.concurrent包下的容器都是fail-safe的,在多线程下并发修改,例如,ConcurrentHashMap,CopyOnWrite等。
ConcurrentHashMap
ConcurrentHashMap
1.7
由Segment数组和HashEntry组成,基于数组+链表,采用了分段锁技术,Segment继承于ReentrantLock。Segment 的个数一但初始化就不能改变。
put():尝试获取锁,获取失败则利用scanAndLockForPut()自旋获取锁,如果重试次数达到了MAX_SCAN_RETRIES,则改为阻塞锁获取,保证能获取成功;在Segment中通过key的hashcode定位到HashEntry;遍历该HashEntry,如果不为空则判断传入的key和当前遍历的key是否相等,相等则覆盖旧的value;为空则需要新建一个HashEntry并加入到Segment中,同时会先判断是否需要扩容;释放锁。
get():key通过hash定位到具体的Segment,再通过一次hash定位到具体元素上,因为HashEntry的value属性是用volatile修饰的,保证了内存可见性,所以每次获取时都是最新值。get的整个过程不需要加锁。
缺点:查询是需要遍历链表,效率较低;
1.8
使用CAS + Synchronized保证线程安全。HashEntry改为Node,但作用不变,并且也引入了红黑树。
初始化
初始化通过自旋+CAS完成,变量sizeCtl决定当前初始化状态
-1 说明正在初始化;
-N 说明有N-1个线程正在进行扩容;
表示 table 初始化大小,如果 table 没有初始化;
表示 table 容量,如果 table 已经初始化;
private final Node<K,V>[] initTable() { Node<K,V>[] tab; int sc; while ((tab = table) == null || tab.length == 0) { if ((sc = sizeCtl) < 0) Thread.yield(); else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) { try { if ((tab = table) == null || tab.length == 0) { int n = (sc > 0) ? sc : DEFAULT_CAPACITY; @SuppressWarnings("unchecked") Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n]; table = tab = nt; sc = n - (n >>> 2); } } finally { sizeCtl = sc; } break; } } return tab; }
|
put
public V put(K key, V value) { return putVal(key, value, false); }
final V putVal(K key, V value, boolean onlyIfAbsent) { if (key == null || value == null) throw new NullPointerException(); int hash = spread(key.hashCode()); int binCount = 0; for (Node<K,V>[] tab = table;;) { Node<K,V> f; int n, i, fh; if (tab == null || (n = tab.length) == 0) tab = initTable(); else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) { if (casTabAt(tab, i, null, new Node<K,V>(hash, key, value, null))) break; } else if ((fh = f.hash) == MOVED) tab = helpTransfer(tab, f); else { V oldVal = null; synchronized (f) { if (tabAt(tab, i) == f) { if (fh >= 0) { binCount = 1; for (Node<K,V> e = f;; ++binCount) { K ek; if (e.hash == hash && ((ek = e.key) == key || (ek != null && key.equals(ek)))) { oldVal = e.val; if (!onlyIfAbsent) e.val = value; break; } Node<K,V> pred = e; if ((e = e.next) == null) { pred.next = new Node<K,V>(hash, key, value, null); break; } } } else if (f instanceof TreeBin) { Node<K,V> p; binCount = 2; if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key, value)) != null) { oldVal = p.val; if (!onlyIfAbsent) p.val = value; } } } } if (binCount != 0) { if (binCount >= TREEIFY_THRESHOLD) treeifyBin(tab, i); if (oldVal != null) return oldVal; break; } } } addCount(1L, binCount); return null; }
|
put():根据key计算出hashcode;判断是否需要进行初始化;根据key定位,如果为空表示当前位置可以写入数据,利用CAS尝试写入,失败则自旋保证成功;如果当前位置的hashcode == MOVED == -1,则需要进行扩容;如果都不满足,则利用synchronized锁写入数据;如果数量大于TREEIFY_THRESHOLD 则要转换为红黑树。
public V get(Object key) { Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek; int h = spread(key.hashCode()); if ((tab = table) != null && (n = tab.length) > 0 && (e = tabAt(tab, (n - 1) & h)) != null) { if ((eh = e.hash) == h) { if ((ek = e.key) == key || (ek != null && key.equals(ek))) return e.val; } else if (eh < 0) return (p = e.find(h, key)) != null ? p.val : null; while ((e = e.next) != null) { if (e.hash == h && ((ek = e.key) == key || (ek != null && key.equals(ek)))) return e.val; } } return null; }
|
get():根据计算出来的hashcode寻址,如果在桶上(头结点)就直接返回;如果是红黑树就按照树的方式获取值;都不满足就按照链表方式获取值。
public V put(K key, V value) { return putVal(key, value, false); }
final V putVal(K key, V value, boolean onlyIfAbsent) { if (key == null || value == null) throw new NullPointerException(); int hash = spread(key.hashCode()); int binCount = 0; for (Node<K,V>[] tab = table;;) { Node<K,V> f; int n, i, fh; if (tab == null || (n = tab.length) == 0) tab = initTable(); else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) { if (casTabAt(tab, i, null, new Node<K,V>(hash, key, value, null))) break; } else if ((fh = f.hash) == MOVED) tab = helpTransfer(tab, f); else { V oldVal = null; synchronized (f) { if (tabAt(tab, i) == f) { if (fh >= 0) { binCount = 1; for (Node<K,V> e = f;; ++binCount) { K ek; if (e.hash == hash && ((ek = e.key) == key || (ek != null && key.equals(ek)))) { oldVal = e.val; if (!onlyIfAbsent) e.val = value; break; } Node<K,V> pred = e; if ((e = e.next) == null) { pred.next = new Node<K,V>(hash, key, value, null); break; } } } else if (f instanceof TreeBin) { Node<K,V> p; binCount = 2; if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key, value)) != null) { oldVal = p.val; if (!onlyIfAbsent) p.val = value; } } } } if (binCount != 0) { if (binCount >= TREEIFY_THRESHOLD) treeifyBin(tab, i); if (oldVal != null) return oldVal; break; } } } addCount(1L, binCount); return null; }
|
- 判断Node[]数组是否初始化,没有则进行初始化操作
- 通过hash定位Node[]数组的索引坐标,是否有Node节点,如果没有则使用CAS进行添加(链表的头结点),添加失败则进入下次循环。
- 检查到内部正在扩容,如果正在扩容,就帮助它一块扩容。
- 如果f!=null,则使用synchronized锁住f元素(链表/红黑二叉树的头元素)f是目标位置元素
4.1 如果是Node(链表结构)则执行链表的添加操作。
4.2 如果是TreeNode(树型结果)则执行树添加操作。
- 判断链表长度已经达到临界值8 就需要把链表转换为树结构。