【jdk1.8源码分析】HashMap

时间：2021-03-08 13:09:20 阅读：0 评论：0 收藏：0 [点我收藏+]

标签：struct obj 进入 exception 集合源码 info related logs int

本文参考Java 集合系列10之 HashMap详细介绍(源码解析)和使用示例及 JDK1.8集合源码阅读

一、HashMap介绍

1.1 前言

Java8的HashMap对之前做了较大的优化，其中最重要的一个优化就是桶中的元素不再唯一按照链表组合，也可以使用红黑树进行存储，总之，目标只有一个，那就是在安全和功能性完备的情况下让其速度更快，提升性能。

1.2 HashMap简介

HashMap 是一个散列表，它存储的内容是键值对(key-value)映射。
HashMap 继承于AbstractMap，实现了Map、Cloneable、java.io.Serializable接口。
HashMap 的实现不是同步的，这意味着它是线程不安全的。它的key、value都可以为null。此外，HashMap中的映射不是有序的。

HashMap 的实例有两个参数影响其性能：“初始容量” 和 “加载因子”。

容量 是哈希表中桶的数量
- 初始容量 只是哈希表在创建时的容量。
加载因子 是哈希表在其容量自动增加之前可以达到多满的一种尺度。当哈希表中的条目数超出了加载因子与当前容量的乘积时，则要对该哈希表进行 rehash 操作（即重建内部数据结构），从而哈希表将具有大约两倍的桶数。
- 通常，默认加载因子是 0.75, 这是在时间和空间成本上寻求一种折衷。加载因子过高虽然减少了空间开销，但同时也增加了查询成本（在大多数 HashMap 类的操作中，包括 get 和 put 操作，都反映了这一点）。在设置初始容量时应该考虑到映射中所需的条目数及其加载因子，以便最大限度地减少 rehash 操作次数。如果初始容量大于最大条目数除以加载因子，则不会发生 rehash 操作。

1.3 HashMap的数据结构

技术图片

说明：上图很形象的展示了HashMap的数据结构（数组+链表+红黑树），桶中的结构可能是链表，也可能是红黑树，红黑树的引入是为了提高效率。

二、HashMap源码分析

2.1 类的继承关系

public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable

技术图片

可以看到HashMap继承自父类（AbstractMap），实现了Map、Cloneable、Serializable接口。其中：

Map接口定义了一组通用的操作；
Cloneable接口则表示可以进行拷贝，在HashMap中，实现的是浅层次拷贝，即对拷贝对象的改变会影响被拷贝的对象；
Serializable接口表示HashMap实现了序列化，即可以将HashMap对象保存至本地，之后可以恢复状态。

Map接口的说明在【jdk1.8源码分析】总章中可以找到

2.2 HashMap的成员变量

下面我们先来看一下HashMap里面的成员变量：

//默认初始化map的容量：16
//default initial capacity
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;

//map的最大容量：2^30
//maximum_capacity
static final int MAXIMUM_CAPACITY = 1 << 30;

//默认的填充因子：0.75，能较好的平衡时间与空间的消耗
//default load factor
static final float DEFAULT_LOAD_FACTOR = 0.75f;

//将链表(桶)转化成红黑树的临界值
//treeify threshold
static final int TREEIFY_THRESHOLD = 8;

//将红黑树转成链表(桶)的临界值
//ubtreeify threshold
static final int UNTREEIFY_THRESHOLD = 6;

//转变成树的table的最小容量，小于该值则不会进行树化
//min treeify capacity
static final int MIN_TREEIFY_CAPACITY = 64;

//上图所示的数组，长度总是2的幂次
transient Node<K,V>[] table;

//map中的键值对集合
transient Set<Map.Entry<K,V>> entrySet;

//map中键值对的数量
transient int size;

//用于统计map修改次数的计数器，用于fail-fast抛出ConcurrentModificationException
transient int modCount;

//大于该阈值，则重新进行扩容，threshold = capacity(table.length) * load factor
int threshold;

//填充因子
final float loadFactor;

可以看到，HashMap里是以Node节点数组的形式存放数据的，Node数据结构比较简单，这里我们也来看一下：

//Entry接口在笔者的总章里有介绍。
static class Node<K,V> implements Map.Entry<K,V> {
  // key & value 的 hash值
  final int hash;
  final K key;
  V value;
  //指向下一个节点
  Node<K,V> next;

  Node(int hash, K key, V value, Node<K,V> next) {
    this.hash = hash;
    this.key = key;
    this.value = value;
    this.next = next;
  }

  public final K getKey()        { return key; }
  public final V getValue()      { return value; }
  public final String toString() { return key + "=" + value; }

  public final int hashCode() {
    return Objects.hashCode(key) ^ Objects.hashCode(value);
  }

  public final V setValue(V newValue) {
    V oldValue = value;
    value = newValue;
    return oldValue;
  }

  public final boolean equals(Object o) {
    if (o == this)
      return true;
    // 如果o是Map.Entry接口的实例
    if (o instanceof Map.Entry) {
      Map.Entry<?,?> e = (Map.Entry<?,?>)o;
      if (Objects.equals(key, e.getKey()) &&
          Objects.equals(value, e.getValue()))
        return true;
    }
    return false;
  }
}

由于比较简单，这里就不详细介绍了哈。

2.3 HashMap构造函数

2.3.1 无参数构造函数

// 使用默认的初始容量（16）和默认的填充因子（0.75）构造一个空的HashMap。
public HashMap() {
  //其他成员变量也都是默认的
  this.loadFactor = DEFAULT_LOAD_FACTOR;
}

2.3.2 传初始化容量

（建议如果知道要使用的map容量，都使用这种）

// 构造一个具有指定初始容量和默认填充因子（0.75）的空HashMap。
public HashMap(int initialCapacity) {
        this(initialCapacity, DEFAULT_LOAD_FACTOR);
    }

2.3.3 传初始化容量以及填充因子

源码部分

// 构造一个具有指定初始容量和填充因子的空HashMap。
public HashMap(int initialCapacity, float loadFactor) {
  if (initialCapacity < 0)
    throw new IllegalArgumentException("Illegal initial capacity: " +
                                       initialCapacity);
  if (initialCapacity > MAXIMUM_CAPACITY)
    initialCapacity = MAXIMUM_CAPACITY;
  if (loadFactor <= 0 || Float.isNaN(loadFactor))
    throw new IllegalArgumentException("Illegal load factor: " +
                                       loadFactor);
  this.loadFactor = loadFactor;
  //tableSizeFor()是用来将初始化容量转化大于输入参数且最近的2的整数次幂的数，比如initialCapacity = 7，那么转化后就是8。
  this.threshold = tableSizeFor(initialCapacity);
}

tableSizeFor()

tableSizeFor()，将初始化容量转化大于或等于最接近输入参数的2的整数次幂的数:

static final int tableSizeFor(int cap) {
  int n = cap - 1;
  n |= n >>> 1;
  n |= n >>> 2;
  n |= n >>> 4;
  n |= n >>> 8;
  n |= n >>> 16;
  return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}

|是或运算符，比如说0100 | 0011 = 0111，>>>是无符号右移，忽略符号位，空位都以0补齐，比如说0100 >>> 2 = 0001，现在来说一下这么做的目的：

首先>>>和|的操作的目的就是把n从最高位的1以下都填充为1，以010011为例，010011 >>> 1 = 001001，然后001001 | 010011 = 011011，然后再把011011无符号右移两位：011011 >>> 2 = 000110，然后000110 | 011011 = 011111，后面的4、8、16计算过程就都省去了，int类型为32位，所以计算到16就全部结束了，最终得到的就是最高位及其以下的都为1，这样就能保证得到的结果肯定大于或等于原来的n且为奇数，最后再加上1，那么肯定是：大于且最接近输入值的2的整数次幂的数。

? 那么为什么要先cap - 1呢，我们可以先思考以下，如果传进来的本身就是2的整数幂次，比如说01000，10进制是8，那么如果不减，得到的结果就是16，显然不对。所以先减1的目的是cap如果恰好是2的整数次幂，那么返回的也是本身。

合起来得到这个tableSizeFor()方法的目的：返回大于或等于最接近输入参数的2的整数次幂的数。另外，笔者特意回去看了JDK1.7的源码，发现1.7用的是roundUpToPowerOf2()方法，里面用到里了>>以及减操作，性能上来说肯定还1.8的高。

2.3.4 传map转化为HashMap的构造函数

源码部分

// 构造一个具有与指定Map相同的映射关系的新HashMap。 使用默认的加载因子（0.75）和足以将映射保存在指定Map中的初始容量创建HashMap。
public HashMap(Map<? extends K, ? extends V> m) {
  this.loadFactor = DEFAULT_LOAD_FACTOR;
  putMapEntries(m, false);
}

putMapEntries()

//实现Map.putAll和Map构造函数
//evict表示是不是初始化map，false表示是初始化map
final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
  //获取m中键值对的数量
  int s = m.size();
  if (s > 0) {
    if (table == null) {
      //计算map的容量，键值对的数量 = 容量 * 填充因子
      float ft = ((float)s / loadFactor) + 1.0F;
      int t = ((ft < (float)MAXIMUM_CAPACITY) ?
               (int)ft : MAXIMUM_CAPACITY);
      //如果容量大于了阈值，则重新计算阈值。
      if (t > threshold)
        threshold = tableSizeFor(t); // 这个函数在2.3.3中介绍过
    }
    //如果table已经有，且键值对数量大于了阈值，进行扩容
    else if (s > threshold)
      resize(); // 在2.4详细介绍
    for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
      K key = e.getKey();
      V value = e.getValue();
      //实现Map.put和相关方法	
      putVal(hash(key), key, value, false, evict);	// 在2.4详细介绍
    }
  }
}

2.4 HashMap中重要方法解析

2.4.1 resize 函数

final Node<K,V>[] resize() {
    // 当前table保存
    Node<K,V>[] oldTab = table;
    // 保存table大小
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    // 保存当前阈值 
    int oldThr = threshold;
    int newCap, newThr = 0;
    // 如果之前table大小大于0
    if (oldCap > 0) {
        // 如果之前table大于最大容量
        if (oldCap >= MAXIMUM_CAPACITY) {
            // 阈值为最大整形
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        // 容量翻倍，使用左移，效率更高
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
            oldCap >= DEFAULT_INITIAL_CAPACITY)
            // 阈值翻倍
            newThr = oldThr << 1; // double threshold
    }
    // 之前阈值大于0
    else if (oldThr > 0)
        newCap = oldThr;
    // oldCap = 0并且oldThr = 0，使用缺省值（如使用HashMap()构造函数，之后再插入一个元素会调用resize函数，会进入这一步）
    else {           
        newCap = DEFAULT_INITIAL_CAPACITY;
        //阈值 = 默认填充因子 * map的容量
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    
    // 如果新阈值为0
    if (newThr == 0) {
        // 容量 = 新容量 * 填充因子
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    threshold = newThr;
    @SuppressWarnings({"rawtypes","unchecked"})
    // 初始化table
    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    table = newTab;
    // 之前的table已经初始化过
    if (oldTab != null) {
        // 复制元素，重新进行hash
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                oldTab[j] = null;
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e;
                else if (e instanceof TreeNode)
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                else { // preserve order
                    Node<K,V> loHead = null, loTail = null;
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    // 将同一桶中的元素根据(e.hash & oldCap)是否为0进行分割，分成两个不同的链表，完成rehash
                    do {
                        next = e.next;
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}

思想分析

可以看到，resize()方法对整个数组以及桶进行了遍历，极其耗费性能，所以再次强调在我们明确知道map要用的容量的时候，使用指定初始化容量的构造函数。

在resize前和resize后的元素布局如下：

技术图片

再次强调一下，拆分后的结果不一定是均分，要看你存的值

2.4.2 putVal 函数

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        //声明了一个局部变量 tab,局部变量 Node 类型的数据 p,int 类型 n,i
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        //首先将当前 hashmap 中的 table(哈希表)赋值给当前的局部变量 tab,然后判断tab 是不是空或者长度是不是 0,实际上就是判断当前 hashmap 中的哈希表是不是空或者长度等于 0
        if ((tab = table) == null || (n = tab.length) == 0)
        //如果是空的或者长度等于0,代表现在还没哈希表,所以需要创建新的哈希表,默认就是创建了一个长度为 16 的哈希表
            n = (tab = resize()).length;
        //将当前哈希表中与要插入的数据位置对应的数据取出来,(n - 1) & hash就是找当前要插入的数据应该在哈希表中的位置,如果没找到,代表哈希表中当前的位置是空的,否则就代表找到数据了, 并赋值给变量 p
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);//创建一个新的数据,这个数据没有下一条,并将数据放到当前这个位置
        else {//代表要插入的数据所在的位置是有内容的
        //声明了一个节点 e, 一个 key k
            Node<K,V> e; K k;
            if (p.hash == hash && //如果当前位置上的那个数据的 hash 和我们要插入的 hash 是一样,代表没有放错位置
            //如果当前这个数据的 key 和我们要放的 key 是一样的,实际操作应该是就替换值
                ((k = p.key) == key || (key != null && key.equals(k))))
                //将当前的节点赋值给局部变量 e
                e = p;
            else if (p instanceof TreeNode)//如果当前节点的 key 和要插入的 key 不一样,然后要判断当前节点是不是一个红黑色类型的节点
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);//如果是就创建一个新的树节点,并把数据放进去
            else {
                //如果不是树节点,代表当前是一个链表,那么就遍历链表
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {//如果当前节点的下一个是空的,就代表没有后面的数据了
                        p.next = newNode(hash, key, value, null);//创建一个新的节点数据并放到当前遍历的节点的后面
                        if (binCount >= TREEIFY_THRESHOLD - 1) // 重新计算当前链表的长度是不是超出了限制
                            treeifyBin(tab, hash);//超出了之后就将当前链表转换为树,注意转换树的时候,如果当前数组的长度小于MIN_TREEIFY_CAPACITY(默认 64),会触发扩容,我个人感觉可能是因为觉得一个节点下面的数据都超过8 了,说明 hash寻址重复的厉害(比如数组长度为 16 ,hash 值刚好是 0或者 16 的倍数,导致都去同一个位置),需要重新扩容重新 hash
                        break;
                    }
                    //如果当前遍历到的数据和要插入的数据的 key 是一样,和上面之前的一样,赋值给变量 e,下面替换内容
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { //如果当前的节点不等于空,
                V oldValue = e.value;//将当前节点的值赋值给 oldvalue
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value; //将当前要插入的 value 替换当前的节点里面值
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;//操作次数加1
        if (++size > threshold)
            resize();//如果当前的 hash表的长度已经超过了当前 hash 需要扩容的长度, 重新扩容,条件是 haspmap 中存放的数据超过了临界值(经过测试),而不是数组中被使用的下标
        afterNodeInsertion(evict);
        return null;
    }

2.4.3 getNode 函数

final Node<K,V> getNode(int hash, Object key) {
    Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
    // table已经初始化，长度大于0，根据hash寻找table中的项也不为空
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (first = tab[(n - 1) & hash]) != null) {
        // 桶中第一项(数组元素)相等
        if (first.hash == hash && // always check first node
            ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        // 桶中不止一个结点
        if ((e = first.next) != null) {
            // 为红黑树结点
            if (first instanceof TreeNode)
                // 在红黑树中查找
                return ((TreeNode<K,V>)first).getTreeNode(hash, key);
            // 否则，在链表中查找
            do {
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    return null;
}

2.4.4 get 函数

public V get(Object key) {
  Node<K,V> e;
  return (e = getNode(hash(key), key)) == null ? null : e.value;
}

final Node<K,V> getNode(int hash, Object key) {
  Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
  //先是判断一通table是否为空以及根据hash找到存放的table数组的下标，并赋值给临时变量
  if ((tab = table) != null && (n = tab.length) > 0 &&
      (first = tab[(n - 1) & hash]) != null) {
    //总是先检查数组下标第一个节点是否满足key，满足则返回
    if (first.hash == hash &&
        ((k = first.key) == key || (key != null && key.equals(k))))
      return first;
    //如果第一个与key不相等，则循环查看桶
    if ((e = first.next) != null) {
      //检查是否为树节点，是的话采用树节点的方法来获取对应的key的值
      if (first instanceof TreeNode)
        return ((TreeNode<K,V>)first).getTreeNode(hash, key);
      //do-while循环判断，直到找到为止
      do {
        if (e.hash == hash &&
            ((k = e.key) == key || (key != null && key.equals(k))))
          return e;
      } while ((e = e.next) != null);
    }
  }
  return null;
}

可以发现源码作者很喜欢在判断的时候赋值，不知道这个是不是个编程的好习惯。!?(?_?;?

2.4.5 put 函数

public V put(K key, V value) {
  return putVal(hash(key), key, value, false, true);
}

/**
 * Implements Map.put and related methods
 * @param hash key的hash值
 * @param key
 * @param value
 * @param onlyIfAbsent 如果为true，则在有值的时候不会更新
 * @param evict false表示在创建map
 */
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
  Node<K,V>[] tab; Node<K,V> p; int n, i;
  //如果为空，则扩容。注意这里的赋值操作，关系到下面
  if ((tab = table) == null || (n = tab.length) == 0)
    n = (tab = resize()).length;
  //如果tab对应的数组位置为空，则创建新的node，并指向它
  if ((p = tab[i = (n - 1) & hash]) == null)
    // newNode方法就是返回Node：return new Node<>(hash, key, value, next);
    tab[i] = newNode(hash, key, value, null); 
  else {
    Node<K,V> e; K k;
    //如果比较hash值和key的值都相等，说明要put的键值对已经在里面，赋值给e
    if (p.hash == hash &&
        ((k = p.key) == key || (key != null && key.equals(k))))
      e = p;
    //如果p节点是树节点，则执行插入树的操作
    else if (p instanceof TreeNode)
      e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
    //不是树节点且数组中第一个也不是，则在桶中查找
    else {
      for (int binCount = 0; ; ++binCount) {
        //找到了最后一个都不满足的话，则在最后插入节点。注意这里的e = p.next，赋值兼具判断都在if里了
        if ((e = p.next) == null) 
          p.next = newNode(hash, key, value, null);
          //之前field说明中的，如果桶中的数量大于树化阈值，则转化成树，第一个是-1
          if (binCount >= TREEIFY_THRESHOLD - 1)
            treeifyBin(tab, hash);
          break;
        }
      	//在桶中找到了对应的key，赋值给e，退出循环
        if (e.hash == hash &&
            ((k = e.key) == key || (key != null && key.equals(k))))
          break;
      	//没有找到，则继续向下一个节点寻找
        p = e;
      }
    }
  	//上面循环中找到了e，则根据onlyIfAbsent是否为true来决定是否替换旧值
    if (e != null) {
      V oldValue = e.value;
      if (!onlyIfAbsent || oldValue == null)
        e.value = value;
      //钩子函数，用于给LinkedHashMap继承后使用，在HashMap里是空的
      afterNodeAccess(e);
      return oldValue;
    }
  }
  //修改计数器+1
  ++modCount;
  //实际大小+1， 如果大于阈值，重新计算并扩容
  if (++size > threshold)
    resize();
  //钩子函数，用于给LinkedHashMap继承后使用，在HashMap里是空的
  afterNodeInsertion(evict);
  return null;
}

可以看到真正执行put的是里面的putVal()方法。里面的插入逻辑一步步下来还是很清晰的。

2.4.6 remove 函数

public V remove(Object key) {
  Node<K,V> e;
  //与之前的put、get一样，remove也是调用其他的方法
  return (e = removeNode(hash(key), key, null, false, true)) == null ?
    null : e.value;
}
/**
 * Implements Map.remove and related methods
 *
 * @param hash key的hash值
 * @param key 
 * @param value 与下面的matchValue结合，如果matchValue为false，则忽略value
 * @param matchValue 为true，则判断是否与value相等
 * @param movable 主要跟树节点的remove有关，为false，则不移动其他的树节点
 */
final Node<K,V> removeNode(int hash, Object key, Object value,
                               boolean matchValue, boolean movable) {
  Node<K,V>[] tab; Node<K,V> p; int n, index;
  //老规矩，还是先判断table是否为空之类的逻辑，注意赋值操作
  if ((tab = table) != null && (n = tab.length) > 0 &&
      (p = tab[index = (n - 1) & hash]) != null) {
    Node<K,V> node = null, e; K k; V v;
    //对下标节点进行判断，如果相同，则赋给临时节点
    if (p.hash == hash &&
        ((k = p.key) == key || (key != null && key.equals(k))))
      node = p;
    else if ((e = p.next) != null) {
      //为树节点，则按照树节点的操作来进行查找并返回
      if (p instanceof TreeNode)
        node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
      else {
        //do-while循环查找
        do {
          if (e.hash == hash &&
              ((k = e.key) == key ||
               (key != null && key.equals(k)))) {
            node = e;
            break;
          }
          p = e;
        } while ((e = e.next) != null);
      }
    }
    //如果找到了key对应的node，则进行删除操作
    if (node != null && (!matchValue || (v = node.value) == value ||
                         (value != null && value.equals(v)))) {
      //为树节点，则进行树节点的删除操作
      if (node instanceof TreeNode)
        ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
      //如果p == node，说明该key所在的位置为数组的下标位置，所以下标位置指向下一个节点即可
      else if (node == p)
        tab[index] = node.next;
      //否则的话，key在桶中，p为node的上一个节点，p.next指向node.next即可
      else
        p.next = node.next;
      //修改计数器
      ++modCount;
      --size;
      //钩子函数，与上同
      afterNodeRemoval(node);
      return node;
    }
  }
  return null;
}

这里提到里的remove的话，肯定与之联想到的就是其抛出ConcurrentModificationException。举个栗子：

// 并发修改异常
Map<String, Integer> map = new HashMap<>();
map.put("GoddessY", 1);
map.put("Joemsu", 2);
for (String a : map.keySet()) {
  if ("GoddessY".equals(a)) {
    map.remove(a);
  }
}

这里我们再来看一下其在循环过程中抛出该异常的源码（以keySet()为例）：

public Set<K> keySet() {
  Set<K> ks;
  return (ks = keySet) == null ? (keySet = new KeySet()) : ks;
}

final class KeySet extends AbstractSet<K> {
  public final Iterator<K> iterator()     { return new KeyIterator(); }
}

final class KeyIterator extends HashIterator implements Iterator<K> {
  public final K next() { return nextNode().key; }
}

abstract class HashIterator {
  //指向下一个节点
  Node<K,V> next;
  //指向当前节点
  Node<K,V> current;
  //迭代前的修改次数
  int expectedModCount;
  //当前下标
  int index;

  HashIterator() {
    //注意这里：将修改计数器值赋给expectedModCount
    expectedModCount = modCount;
    //下面一顿初始化。。。
    Node<K,V>[] t = table;
    current = next = null;
    index = 0;
    //在table数组中找到第一个下标不为空的节点。
    if (t != null && size > 0) {
      do {} while (index < t.length && (next = t[index++]) == null);
    }
  }
  //通过判断next是否为空，来决定是否hasNext()
  public final boolean hasNext() {
    return next != null;
  }
  //这里就是抛出ConcurrentModificationException的地方
  final Node<K,V> nextNode() {
    Node<K,V>[] t;
    Node<K,V> e = next;
    //如果modCount与初始化传进去的modCount不同，则抛出并发修改的异常
    if (modCount != expectedModCount)
      throw new ConcurrentModificationException();
    if (e == null)
      throw new NoSuchElementException();
    //如果一个下标对应的桶空了，则接着在数组里找其他下标不为空的桶，同时赋值给next
    if ((next = (current = e).next) == null && (t = table) != null) {
      do {} while (index < t.length && (next = t[index++]) == null);
    }
    return e;
  }
    
  //使用迭代器的remove不会抛出ConcurrentModificationException异常，原因如下：
  public final void remove() {
    Node<K,V> p = current;
    if (p == null)
      throw new IllegalStateException();
    if (modCount != expectedModCount)
      throw new ConcurrentModificationException();
    current = null;
    K key = p.key;
    removeNode(hash(key), key, null, false, false);
    //注意这里：对expectedModCount重新进行了赋值。所以下次比较的时候还是相同的
    expectedModCount = modCount;
  }
}

2.4.7 treeifyBin 函数

最后我们再来看一下将桶变成红黑树的代码吧，具体的树结构之类的大概会放在TreeMap里讲解，这里不仔细介绍。

final void treeifyBin(Node<K,V>[] tab, int hash) {
  int n, index; Node<K,V> e;
  //这里MIN_TREEIFY_CAPACITY派上了用场，及时单个桶数量达到了树化的阈值，总的容量没到，也不会进行树化
  if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
    resize();
  else if ((e = tab[index = (n - 1) & hash]) != null) {
    TreeNode<K,V> hd = null, tl = null;
    do {
      // 返回树节点 return new TreeNode<>(p.hash, p.key, p.value, next);
      TreeNode<K,V> p = replacementTreeNode(e, null);
      //为空说明是第一个节点，作为树的根节点
      if (tl == null)
        hd = p;
      //设置树的前后节点
      else {
        p.prev = tl;
        tl.next = p;
      }
      tl = p;
    } while ((e = e.next) != null);
    //对整棵树进行处理，形成红黑树
    if ((tab[index] = hd) != null)
      hd.treeify(tab);
  }
}

三、总结

下面是一些关于HashMap的特征：

允许key和value为null
基本上和Hashtable（已弃用）相似，除了非同步以及键值可以为null
不能保证顺序
访问集合的时间与map的容量和键值对的大小成比例
影响HashMap性能的两个变量：填充因子和初始化容量
通常来说，默认的填充因为0.75是一个时间和空间消耗的良好平衡。较高的填充因为减少了空间的消耗，但是增加了查找的时间
最好能够在创建HashMap的时候指定其容量，这样能存储效率比使其存储空间不够后自动增长更高。毕竟重新调整耗费性能
使用大量具有相同hashcode值的key，将降低hash表的表现，最好能实现key的comparable
注意hashmap是不同步的。如果要同步请使用Map m = Collections.synchronizedMap(new HashMap(...));
除了使用迭代器的remove方法外其的其他方式删除，都会抛出ConcurrentModificationException.
map通常情况下都是hash桶结构，但是当桶太大的时候，会转换成红黑树，可以增加在桶太大情况下访问效率，但是大多数情况下，结构都以桶的形式存在，所以检查是否存在树节点会增加访问方法的时间

【jdk1.8源码分析】HashMap

标签：struct obj 进入 exception 集合源码 info related logs int

原文地址：https://www.cnblogs.com/tiantian152/p/14491126.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

【jdk1.8源码分析】HashMap

一、HashMap介绍

1.1 前言

1.2 HashMap简介

1.3 HashMap的数据结构

二、HashMap源码分析

2.1 类的继承关系

2.2 HashMap的成员变量

2.3 HashMap构造函数

2.3.1 无参数构造函数

2.3.2 传初始化容量

2.3.3 传初始化容量以及填充因子

源码部分

tableSizeFor()

2.3.4 传map转化为HashMap的构造函数

源码部分

putMapEntries()

2.4 HashMap中重要方法解析

2.4.1 resize 函数

思想分析

2.4.2 putVal 函数

2.4.3 getNode 函 数

2.4.4 get 函数

2.4.5 put 函数

2.4.6 remove 函数

2.4.7 treeifyBin 函数

三、总结

2.4.3 getNode 函数