JDK8 HashMap实现原理

JDK8 HashMap principle of realization

Posted by Monk on May 8, 2019

JDK8 HashMap实现原理

1. 存储结构

  1. 数据结构:数组+链表/红黑树
  2. 使用常量 TREEIFY_THRESHOLD 来控制是否切换到平衡树来存储。目前,这个常量值是8,这意味着当有超过8个元素的索引一样时,HashMap会使用树来存储它们。

2. Hash冲突

  1. 产生原因:HashMap中调用hashCode()方法来计算hashCode。由于在Java中两个不同的对象可能有一样的hashCode,所以不同的键可能有一样hashCode,从而导致冲突的产生。
  2. 解决冲突:当冲突节点数不小于8-1时,转换成红黑树。
    • HashMap在处理冲突时使用链表存储相同索引的元素。
    • 当同一hash桶中的元素数量超过特定的值便会由链表切换到平衡树
  3. 红黑树转换过程

3. 初始化和扩容

  1. 初始化:当调用new HashMap()时 :
    public HashMap() {
      // DEFAULT_INITIAL_CAPACITY 默认的初始化容量为16
      // DEFAULT_LOAD_FACTOR 默认的负载因子默认为0.75f
      this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);
    }
    
  2. 扩容
    • 什么时候需要扩容:HashMap对象内部的数组无法装载更多的元素时,对象就需要扩大数组的长度,以便能装入更多的元素。当然Java里的数组是无法自动扩容的,方法是使用一个新的数组代替已有的容量小的数组。
    • 创建一个新的Entry空数组,长度是原数组的2倍。
    • 遍历原Entry数组,把所有的Entry重新Hash到新数组。

4. 源码分析

  1. put操作:将指定的值与此映射中的指定键相关联。
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                    boolean evict) {
         Node<K,V>[] tab; Node<K,V> p; int n, i;
         // 如果当前map中无数据,执行resize方法。并且返回n
         if ((tab = table) == null || (n = tab.length) == 0)
             n = (tab = resize()).length;
         // 如果要插入的键值对要存放的这个位置刚好没有元素,那么封装成Node对象,放在这个位置上
         if ((p = tab[i = (n - 1) & hash]) == null)
             tab[i] = newNode(hash, key, value, null);
         // 否则的话,说明这上面有元素
         else {
             Node<K,V> e; K k;
             // 如果这个元素的key与要插入的一样,那么就替换。
             if (p.hash == hash &&
                 ((k = p.key) == key || (key != null && key.equals(k))))
                 e = p;
             //1.如果当前节点是TreeNode类型的数据,执行putTreeVal方法
             else if (p instanceof TreeNode)
                 e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
             else {
             	// 遍历链表的数据
                 for (int binCount = 0; ; ++binCount) {
                     if ((e = p.next) == null) {
                         p.next = newNode(hash, key, value, null);
                         // 2.判断链上的数据长度,如果大于红黑树的条件,执行treeifyBin()
                         if (binCount >= TREEIFY_THRESHOLD - 1)
                         	// treeifyBin()就是将链表转换成红黑树。
                             treeifyBin(tab, hash);
                         break;
                     }
                     if (e.hash == hash &&
                         ((k = e.key) == key || (key != null && key.equals(k))))
                         break;
                     p = e;
                 }
             }
             if (e != null) { // existing mapping for key
                 V oldValue = e.value;
                 if (!onlyIfAbsent || oldValue == null)
                     e.value = value;
                 afterNodeAccess(e);
                 return oldValue;
             }
         }
         ++modCount;
         //判断阈值,决定是否扩容
         if (++size > threshold)
             resize();
         afterNodeInsertion(evict);
         return null;
     }
    

    一图胜千言(以下图片来自知乎):

  2. get操作
  3. resize操作

5. HashMap和HashTable的区别

  1. HashMap:
    • 线程不安全的
    • 允许有null的键和值
    • 效率较高
  2. HashTable
    • 线程安全的,使用了Synchronized来进行方法同步
    • 不允许有null 的键和值
    • 效率较低