数据结构--ConcurrentHashMap原理及解析

HashMap本身不是线程安全的，通常在多线程情况下可以去使用HashTable替代HashMap使用，该类中基本所有的操作方法都采用synchronized进行修饰，所以在高并发的情况下，每次只能有一个线程获取对象监视器锁，并发性能太低。

针对上述情况，就产生了ConcurrentHashMap这个类去解决上述问题，提高效率。

从整体上看，这三个容器的定位可以简单理解为：

HashMap：非线程安全，适合单线程或外部已做好同步控制的场景
Hashtable：线程安全，但基本是整表同步，并发度较低
ConcurrentHashMap：通过更细粒度的并发控制提升吞吐，读操作大多数情况下不需要整表加锁

另外还需要注意版本背景：**JDK 7中的ConcurrentHashMap更强调Segment分段锁设计，而JDK 8开始主要采用Node[] + CAS + synchronized + 红黑树这一套结构。**下面的分析主要基于JDK 8思路展开。

ConcurrentHashMap重要参数分析

table：默认为null，初始化发生在第一次插入操作，默认大小为16的数组，用来存储Node节点数据，扩容时大小总是2的幂次方

1	`transient volatile Node<K,V>[] table;`

nextTable：默认为null，扩容时使用，大小为原数组的2倍。

1	`private transient volatile Node<K,V>[] nextTable;`

sizeCtl：该属性用来控制table的初始化和扩容操作。

-1：表示当前数组正在初始化
-N：表示当前争优N-1个线程进行扩容操作
0：数组还未初始化
N：1. table未初始化，表示table需要初始化的大小；2. table初始化完成，表示扩容阈值。源码观察可知该值始终是 table容量的0.75倍。

1
2
3

volatile int sizeCtl;

// sizeCtl = n - (n>>>2)

可以把sizeCtl理解成一个“多角色控制字段”：

在初始化前，它像是一个容量提示值
初始化完成后，它又表示扩容阈值
进入扩容阶段后，它还承担了扩容协作状态标记的角色

因此sizeCtl并不是一个简单的“当前大小”或“容量字段”，而是ConcurrentHashMap里最关键的状态控制变量之一。

sun.misc.Unsage U：利用该类实现CAS算法，实现一种乐观锁的操作。

Node：主要存放 key-value对，并且具有next域。可以保存key、value、hash值的数据结构。

static class Node<K,V> implements Map.Entry<K,V> {
    final int hash;
    final K key;
    //使用 volatile进行修饰 保证可见性
    volatile V val;
    volatile Node<K,V> next;
 ... 
}

ForwardingNode：一个特殊的节点，key、value、hash值均为null，存储着对nextTable的引用

static final class ForwardingNode<K,V> extends Node<K,V> {
    final Node<K,V>[] nextTable;
    ForwardingNode(Node<K,V>[] tab) {
        super(MOVED, null, null, null);
        this.nextTable = tab;
    }
  ...
}

只有table发生扩容的时候，ForwardingNode才有作用，作为一个占位符放在table中表示当前节点为null或者已经被移动。

它的作用不只是“占位”。对于扩容中的ConcurrentHashMap来说，ForwardingNode同时还是一个迁移完成标记 + 查询跳转入口：其他线程如果访问到这个节点，就能意识到当前桶的数据已经迁移，并继续去nextTable中查找或协助扩容。

ConcurrentMap源码解析

ConcurrentHashMap初始化

public class ConcurrentHashMap<K,V> extends AbstractMap<K,V>
    implements ConcurrentMap<K,V>, Serializable {
    //构造一个空的map ，初始容量为默认值 16
    public ConcurrentHashMap() {
    
    }
    //设定map的初始容量
    public ConcurrentHashMap(int initialCapacity) {
        //小于0 直接抛出异常
        if (initialCapacity < 0)
            throw new IllegalArgumentException();
        //计算过程类比于 1.5 * initialCapacity + 1
        int cap = ((initialCapacity >= (MAXIMUM_CAPACITY >>> 1)) ?
                   MAXIMUM_CAPACITY :
                   tableSizeFor(initialCapacity + (initialCapacity >>> 1) + 1));
        //计算出的最终容量进行赋值
        this.sizeCtl = cap;
    }
    //插入一个map
    public ConcurrentHashMap(Map<? extends K, ? extends V> m) {
        this.sizeCtl = DEFAULT_CAPACITY;
        putAll(m);
    }    
    //设定map的初始容量及加载因子
    public ConcurrentHashMap(int initialCapacity, float loadFactor) {
        this(initialCapacity, loadFactor, 1);
    }        
    //设定map的初始容量，加载因子以及并发度 - 预计同事可操作数据的线程数
    public ConcurrentHashMap(int initialCapacity,
                             float loadFactor, int concurrencyLevel) {
        if (!(loadFactor > 0.0f) || initialCapacity < 0 || concurrencyLevel <= 0)
            throw new IllegalArgumentException();
        //容量会根据并发度进行调整
        if (initialCapacity < concurrencyLevel)   // Use at least as many bins
            initialCapacity = concurrencyLevel;   // as estimated threads
        long size = (long)(1.0 + (long)initialCapacity / loadFactor);
        int cap = (size >= (long)MAXIMUM_CAPACITY) ?
            MAXIMUM_CAPACITY : tableSizeFor((int)size);
        this.sizeCtl = cap;
    }
    
    /**
    * 对传入的初始容量进行操作，向上取整 得到最接近初始值的 符合2的幂次
    */
    private static final int tableSizeFor(int c) {
        int n = c - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }
  ...    
}

此时ConcurrentHashMap的初始化只是初始化了 table的容量，还未直接初始化table。需要等到第一次调用put()后执行。

ConcurrentHashMap插入数据 - put()

向ConcurrentHashMap中插入数据

1 2	`ConcurrentHashMap concurrentHashMap = new ConcurrentHashMap(); concurrentHashMap.put("Android","best");`

put()源码

public V put(K key, V value) {
    return putVal(key, value, false);
}

final V putVal(K key, V value, boolean onlyIfAbsent) {
    //如果key或者value为null 直接抛出异常
    if (key == null || value == null) throw new NullPointerException();
    //计算出key对应的hash值
    int hash = spread(key.hashCode());①
    int binCount = 0;
    for (Node<K,V>[] tab = table;;) {
        Node<K,V> f; int n, i, fh;
        //当前table没有初始化
        if (tab == null || (n = tab.length) == 0)
            //table开始初始化
            tab = initTable();②
        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {③
            //利用CAS方式 直接插入值
            if (casTabAt(tab, i, null,new Node<K,V>(hash, key, value, null)))④
                break;                   // no lock when adding to empty bin
        }
        //表示当前正在扩容
        else if ((fh = f.hash) == MOVED)
            tab = helpTransfer(tab, f);⑤
        else {
            V oldVal = null;
            //获取头节点的监视器锁
            synchronized (f) {
                //在节点插入之前，在进行判断，防止被其他线程修改
                if (tabAt(tab, i) == f) {
                    //当前为链表，在链表中插入新的键值对
                    if (fh >= 0) {
                        //记录链表长度
                        binCount = 1;
                        //开始遍历链表
                        for (Node<K,V> e = f;; ++binCount) {
                            K ek;
                            //如果找到了相等的key
                            if (e.hash == hash &&((ek = e.key) == key ||
                                 (ek != null && key.equals(ek)))) {
                                //直接覆盖旧值
                                oldVal = e.val;
                                if (!onlyIfAbsent)                         
                                    e.val = value;
                                break;
                            }
                            //到了链表末端，直接数据插到链表末端
                            Node<K,V> pred = e;
                            if ((e = e.next) == null) {
                                pred.next = new Node<K,V>(hash, key, value, null);
                                break;
                            }
                        }
                    }
                    //当前数据结构为 红黑树
                    else if (f instanceof TreeBin) {
                        Node<K,V> p;
                        binCount = 2;
                        if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key, value)) != null) {
                            oldVal = p.val;
                            if (!onlyIfAbsent)
                                p.val = value;
                        }
                    }
                }
            }
            //插入数据后再根据实际大小判断是否需要转换成红黑树
            if (binCount != 0) {
                if (binCount >= TREEIFY_THRESHOLD)
                    //这个方法中不一定会进行红黑树的变换，如果当前数据的长度小于64 (MIN_TREEIFY_CAPACITY)
                    //就会执行扩容操作，而不是进行红黑树转化。
                    treeifyBin(tab, i);⑥
                if (oldVal != null)
                    return oldVal;
                break;
            }
        }
    }
    //对当前数组容量进行检查，超过了临界值，就需要扩容
    addCount(1L, binCount);⑦
    return null;
}

put()操作主要包括以下几项：

① int hash = spread(key.hashCode());：计算Hash值

1
2
3

static final int spread(int h) {
    return (h ^ (h >>> 16)) & HASH_BITS;
}

②tab = initTable();：如果table尚未初始化，就需要进行初始化操作

private final Node<K,V>[] initTable() {
    Node<K,V>[] tab; int sc;
    while ((tab = table) == null || tab.length == 0) {
        // 当一个线程发现sizeCtl<0即正在初始化时，意味着另外的线程正在执行初始化操作，其他线程只能让出CPU等待table初始化完成
        if ((sc = sizeCtl) < 0)
            Thread.yield();
        // CAS 一下，将 sizeCtl 设置为 -1，代表抢到了锁 
        else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
            try {
                if ((tab = table) == null || tab.length == 0) {
                    // DEFAULT_CAPACITY 默认初始容量是 16
                    int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
                    // 初始化数组，长度为 16 或初始化时提供的长度
                    Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                    // 将这个数组赋值给 table，table 是 volatile 的
                    table = tab = nt;
                    // 如果 n 为 16 的话，那么这里 sc = 12
                    // 其实就是 0.75 * n
                    sc = n - (n >>> 2);
                }
            } finally {
                // 设置 sizeCtl 为 sc
                sizeCtl = sc;
            }
            break;
        }
    }
    return tab;
}

table初始化的操作有且只有一个线程能够操作，其他线程通过Thread.yield()让出CPU时间片等待初始化完成。

③f = tabAt(tab, i = (n - 1) & hash))：获取hash值转换后得到的存储位置的头节点f。无论链表头节点还是红黑树的根节点都是在数组上的。

1
2
3

static final <K,V> Node<K,V> tabAt(Node<K,V>[] tab, int i) {
    return (Node<K,V>)U.getObjectVolatile(tab, ((long)i << ASHIFT) + ABASE);
}

在JMM中，每个线程都有他自己的工作内存，里面存储着数据的副本，虽然table是volatile修饰的，但不能绝对保证拿到的就是最新的数据，利用U.getObjectVolatile是直接取得指定内存的数据，可以保证每次拿到的都是最新的。

④casTabAt(tab, i, null,new Node<K,V>(hash, key, value, null))：由于发现存储位置上没有元素，则利用CAS直接插入新节点

1
2
3

static final <K,V> boolean casTabAt(Node<K,V>[] tab, int i,Node<K,V> c, Node<K,V> v) {
    return U.compareAndSwapObject(tab, ((long)i << ASHIFT) + ABASE, c, v);
}

利用CAS操作直接将节点放入table对应位置中。但是如果CAS插入失败，意味着是一个并发操作，直接向下继续执行。

这里也体现了ConcurrentHashMap在JDK 8中的一个核心思路：**能用CAS解决的地方尽量先不用锁，只有在桶中已经存在节点并且需要处理链表/红黑树冲突时，才对桶头节点加synchronized。**这意味着锁粒度被控制在“桶级别”，而不是像Hashtable那样把整张表都串行化。

⑤helpTransfer()：帮助数据迁移

final Node<K,V>[] helpTransfer(Node<K,V>[] tab, Node<K,V> f) {
    Node<K,V>[] nextTab; int sc;
    if (tab != null && (f instanceof ForwardingNode) &&
        (nextTab = ((ForwardingNode<K,V>)f).nextTable) != null) {
        int rs = resizeStamp(tab.length);
        while (nextTab == nextTable && table == tab &&
               (sc = sizeCtl) < 0) {
            if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                sc == rs + MAX_RESIZERS || transferIndex <= 0)
                break;
            if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1)) {
                transfer(tab, nextTab);
                break;
            }
        }
        return nextTab;
    }
    return table;
}

⑥treeifyBin()：当完成数据新节点插入后，会进一步对当前链表大小进行调整。当链表长度大于TREEIFY_THRESHOLD阈值，默认8，会进行链表转换红黑树，也可能是仅仅做数组扩容。

private final void treeifyBin(Node<K,V>[] tab, int index) {
    Node<K,V> b; int n, sc;
    if (tab != null) {
        // MIN_TREEIFY_CAPACITY 为 64
        // 所以，如果数组长度小于 64 的时候，其实也就是 32 或者 16 或者更小的时候，会进行数组扩容
        if ((n = tab.length) < MIN_TREEIFY_CAPACITY)
            //扩容
            tryPresize(n << 1);
        // b 是头结点
        else if ((b = tabAt(tab, index)) != null && b.hash >= 0) {
            // 加锁
            synchronized (b) {

                if (tabAt(tab, index) == b) {
                    // 下面就是遍历链表，建立一颗红黑树
                    TreeNode<K,V> hd = null, tl = null;
                    for (Node<K,V> e = b; e != null; e = e.next) {
                       //链表节点转换树节点
                        TreeNode<K,V> p = new TreeNode<K,V>(e.hash, e.key, e.val, null, null);
                        if ((p.prev = tl) == null)
                            hd = p;
                        else
                            tl.next = p;
                        tl = p;
                    }
                    // 将红黑树设置到数组相应位置中
                    setTabAt(tab, index, new TreeBin<K,V>(hd));
                }
            }
        }
    }
}

这里有一个很关键的设计点：当数组长度小于64时，即使链表长度已经达到树化阈值，也会优先选择扩容而不是立即树化。原因在于：这时冲突更可能来自“数组容量还太小”，扩容之后很多节点就能被重新分散到不同桶里，没有必要过早把链表升级成红黑树。

⑦addCount(1L, binCount)：table存储键值对数量增加，然后需要判断是否超过扩容阈值，若超过需要进行扩容操作。

private final void addCount(long x, int check) {
        CounterCell[] as; long b, s;
        if ((as = counterCells) != null ||
            !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
            CounterCell a; long v; int m;
            boolean uncontended = true;
            if (as == null || (m = as.length - 1) < 0 ||
                (a = as[ThreadLocalRandom.getProbe() & m]) == null ||
                !(uncontended = U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {
                fullAddCount(x, uncontended);
                return;
            }
            if (check <= 1)
                return;
            s = sumCount();
        }
        if (check >= 0) {
            Node<K,V>[] tab, nt; int n, sc;
            while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
                   (n = tab.length) < MAXIMUM_CAPACITY) {
                int rs = resizeStamp(n);
                if (sc < 0) {
                    if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                        sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                        transferIndex <= 0)
                        break;
                    if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
                        transfer(tab, nt);
                }
                else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                             (rs << RESIZE_STAMP_SHIFT) + 2))
                    transfer(tab, null);
                s = sumCount();
            }
        }
    }

ConcurrentHashMap扩容操作 - tryPresize()

由上述源码可知，触发扩容动作的情况有两个：

新增节点后，链表长度达到了8，就会调用treeifyBin()对其进行转换，但是如果此时存储的键值对数量如果未到64(最小树形化阈值)，就会触发tryPresize()扩大数组长度至原来的两倍，并调用transfer()进行数据迁移。

新增节点后，会调用addCount()使存储数量 +1 ，还会去检测是否达到扩容阈值，达到时会触发transfer()，重新调整节点的位置。

private final void tryPresize(int size) {
    // c：size 的 1.5 倍，再加 1，再往上取最近的 2 的 n 次方。
    int c = (size >= (MAXIMUM_CAPACITY >>> 1)) ? MAXIMUM_CAPACITY :
        tableSizeFor(size + (size >>> 1) + 1);
    int sc;
    //跳出循环的判断 需要依赖 transfer的操作结束
    while ((sc = sizeCtl) >= 0) {
        Node<K,V>[] tab = table; int n;

        // 初始化数组
        if (tab == null || (n = tab.length) == 0) {
            n = (sc > c) ? sc : c; //取大值
            if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
                try {
                    if (table == tab) {
                        @SuppressWarnings("unchecked")
                        Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                        table = nt;
                        sc = n - (n >>> 2); // 0.75 * n
                    }
                } finally {
                    sizeCtl = sc;
                }
            }
        }
        //已经超过最大上限 就不需要扩容了
        else if (c <= sc || n >= MAXIMUM_CAPACITY)
            break;
        else if (tab == table) {
            int rs = resizeStamp(n);

            if (sc < 0) {
                Node<K,V>[] nt;
                if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                    sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                    transferIndex <= 0)
                    break;
                // 2. 用 CAS 将 sizeCtl 加 1，然后执行 transfer 方法
                //    此时 nextTab 不为 null
                if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
                    transfer(tab, nt);
            }
            // 1. 将 sizeCtl 设置为 (rs << RESIZE_STAMP_SHIFT) + 2)
            //  调用 transfer 方法，此时 nextTab 参数为 null
            else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                         (rs << RESIZE_STAMP_SHIFT) + 2))
                transfer(tab, null);
        }
    }
}

ConcurrentHashMap迁移数据 - transfer() 重要

将原来旧表的数据迁移至新表中。

迁移过程涉及并发操作。原数组长度为n，所以会出现n个迁移任务，让每个线程单独去负责每一个迁移任务，每做完一个任务在检测是否有其他没做完的任务。

transfer()中利用了一个stride(步长)，每个线程负责迁移一部分。

再调用到transfer()的函数中观察到transfer(tab, null)在一次调用过程中只会存在一次，然后其他调用的时候nextTable已经初始化完毕，就不会在调用到空。

private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
       int n = tab.length, stride;
       //设置任务执行区域 NCPU代指CPU核数
       if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
           stride = MIN_TRANSFER_STRIDEC;  //最小长度为 16
       //先进行一次 nextTable初始化 
       //这个过程只会发生一次
       if (nextTab == null) {            
           try {
               @SuppressWarnings("unchecked")
               //容量翻倍
               Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
               //进行赋值 即 nextTable长度为旧表的两倍
               nextTab = nt;
           } catch (Throwable ex) {      // try to cope with OOME
               sizeCtl = Integer.MAX_VALUE;
               return;
           }
           nextTable = nextTab;
           //用于控制迁移的位置
           transferIndex = n;
       }
       
       int nextn = nextTab.length;
       //初始化 ForwardNode 代表正在被迁移的Node hash值 = MOVED
       ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
       //表明该位置的迁移工作已经完成
       boolean advance = true;
       //所有迁移工作中是否完成
       boolean finishing = false; // to ensure sweep before committing nextTab
       // i 代表当前处理的槽位序号  bound 代表要处理的槽位边界 是从后向前的循环方式
       for (int i = 0, bound = 0;;) {
           Node<K,V> f; int fh;
           while (advance) {
               int nextIndex, nextBound;
               if (--i >= bound || finishing)
                   advance = false;
               //表明原数组的所有位置都有相应的线程进行处理
               else if ((nextIndex = transferIndex) <= 0) {
                   i = -1;
                   advance = false;
               }
               else if (U.compareAndSwapInt
                        (this, TRANSFERINDEX, nextIndex,
                         nextBound = (nextIndex > stride ?
                                      nextIndex - stride : 0))) {
                   //nextBound代表这次迁移任务的边界，当为0时，代表已经在处理了
                   bound = nextBound;
                   i = nextIndex - 1;
                   advance = false;
               }
           }
           //表明迁移任务已经结束
           if (i < 0 || i >= n || i + n >= nextn) {
               int sc;
               // 表明迁移任务结束
               if (finishing) {
                   nextTable = null;
                   table = nextTab;
                   //重新调整 sizeCtl 为新数组长度 0.75倍
                   sizeCtl = (n << 1) - (n >>> 1);
                   return;
               }
               // 迁移任务开始前 sizeCtl 会被设置为 rs << RESIZE_STAMP_SHIFT) + 2
               // 每有一个线程参与迁移任务 sizeCtl + 1
               // CAS对其进行 -1操作
               if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
                   if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
                       return;
                   //当sizeCtl 与初始值相同时 意味着所有的迁移已经完毕
                   finishing = advance = true;
                   i = n; // recheck before commit
               }
           }
           //位置 i 没有元素存在，那么直接放入初始化好的 ForwardingNode , 然后告知其他线程该位置已经迁移完毕
           else if ((f = tabAt(tab, i)) == null)
               advance = casTabAt(tab, i, null, fwd);
           //位置 i 上是 ForwardingNode 代表该位置已经迁移完毕
           else if ((fh = f.hash) == MOVED)
               advance = true; // already processed
           else {
               //需要对该位置节点操作加锁
               synchronized (f) {
                   if (tabAt(tab, i) == f) {
                       Node<K,V> ln, hn;
                       //代表当前结构是链表结构
                       if (fh >= 0) {
                           //将该位置的链表一分为二 按照
                           int runBit = fh & n;
                           Node<K,V> lastRun = f;
                           for (Node<K,V> p = f.next; p != null; p = p.next) {
                               int b = p.hash & n;
                               if (b != runBit) {
                                   runBit = b;
                                   lastRun = p;
                               }
                           }
                           if (runBit == 0) {
                               ln = lastRun;
                               hn = null;
                           }
                           else {
                               hn = lastRun;
                               ln = null;
                           }
                           for (Node<K,V> p = f; p != lastRun; p = p.next) {
                               int ph = p.hash; K pk = p.key; V pv = p.val;
                               if ((ph & n) == 0)
                                   ln = new Node<K,V>(ph, pk, pv, ln);
                               else
                                   hn = new Node<K,V>(ph, pk, pv, hn);
                           }
                           //将 ln 放在新数组的 i(即在旧数组的原位置) 上
                           setTabAt(nextTab, i, ln);
                           //将 hn 放在新数组的 i+oldCap 上
                           setTabAt(nextTab, i + n, hn);
                           //设置原数组上该位置的点为 ForwardingNode 代表该位置已经迁移完毕
                           setTabAt(tab, i, fwd);
                           //标记迁移完毕
                           advance = true;
                       }
                       //结构为 红黑树
                       else if (f instanceof TreeBin) {
                           TreeBin<K,V> t = (TreeBin<K,V>)f;
                           TreeNode<K,V> lo = null, loTail = null;
                           TreeNode<K,V> hi = null, hiTail = null;
                           int lc = 0, hc = 0;
                           for (Node<K,V> e = t.first; e != null; e = e.next) {
                               int h = e.hash;
                               TreeNode<K,V> p = new TreeNode<K,V>
                                   (h, e.key, e.val, null, null);
                               if ((h & n) == 0) {
                                   if ((p.prev = loTail) == null)
                                       lo = p;
                                   else
                                       loTail.next = p;
                                   loTail = p;
                                   ++lc;
                               }
                               else {
                                   if ((p.prev = hiTail) == null)
                                       hi = p;
                                   else
                                       hiTail.next = p;
                                   hiTail = p;
                                   ++hc;
                               }
                           }
                           // 如果一分为二后，节点数少于 8，那么将红黑树转换回链表
                           ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
                               (hc != 0) ? new TreeBin<K,V>(lo) : t;
                           hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
                               (lc != 0) ? new TreeBin<K,V>(hi) : t;
                           setTabAt(nextTab, i, ln);
                           setTabAt(nextTab, i + n, hn);
                           setTabAt(tab, i, fwd);
                           advance = true;
                       }
                   }
               }
           }
       }
   }

总结流程：

构建一个nextTable，它的容量是原来的两倍，这个操作只会执行一次。
根据hash值计算对应的存储位置，然后根据tabAt(i)获得对应位置的头节点。
如果头节点为null，就在原table[i]放入ForwardingNode，代表当前位置已经迁移完毕。
如果头节点为链表节点，就构造一个反序链表，把他们分别放在nextTable中的i和i+oldCap位置上。放入成功后，在table[i]放入ForwardingNode，代表迁移完毕。
如果头节点为树节点，也做一个反序操作，并且判断是否需要重新转换成链表，再把处理后的结果分别放到nextTable中的i和i+oldCap位置上。放入成功后，在table[i]放入ForwardingNode，代表迁移完毕
遍历所有的节点就完成了数据迁移工作，让nextTable替代ConcurrentHashMap中的table，并更新sizeCtl为新数据容量的0.75倍，完成扩容。

扩容迁移之所以能高效完成，一个关键原因在于：当数组容量翻倍后，原桶中的节点新位置其实只有两种可能：

仍然留在原索引i
移动到i + oldCap

这就是代码里“低位链表/高位链表”拆分的本质来源。通过判断节点的hash在oldCap这一位上是0还是1，就能快速决定它到底留在原位置，还是移动到偏移后的新位置，而不需要重新做完整哈希计算。

ConcurrentHashMap获取数据 - get()

concurrentHashMap.get(“Android”);

源码解析：

public V get(Object key) {
    Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
    //计算 hash值
    int h = spread(key.hashCode());
    //当前数组不能为空
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (e = tabAt(tab, (n - 1) & h)) != null) {
        // 判断头结点是否就是我们需要的节点
        if ((eh = e.hash) == h) {
            if ((ek = e.key) == key || (ek != null && key.equals(ek)))
                return e.val;
        }
        // 如果头结点的 hash 小于 0，说明 正在扩容 -1 ，或者该位置是红黑树
        else if (eh < 0)
            // 参考 ForwardingNode.find(int h, Object k) 和 TreeBin.find(int h, Object k)
            return (p = e.find(h, key)) != null ? p.val : null;

        // 遍历链表
        while ((e = e.next) != null) {
            if (e.hash == h &&
                ((ek = e.key) == key || (ek != null && key.equals(ek))))
                return e.val;
        }
    }
    return null;
}

总结流程：

首先计算key对应的Hash值，定为到table上的对应位置，如果直接是头节点就返回
此时需要判断头节点的hash值
- hash值等于-1：说明该节点为ForwardingNode，表明此时正在执行扩容操作，调用其find()从nextTable寻找对应值
- hash值等于-2：说明该节点是一个树节点，调用TreeBin.find()去寻找对应值,内部存在着读写锁，可能红黑树正在旋转变色。
- hash值大于等于0：说明该节点是一个链表节点，直接进行链表遍历寻找对应值即可。
如果都没有找到，就返回null

为什么get()不需要加锁？

关键点在于table是由volatile进行修饰的，这个关键字可以保证可见性以及有序性。如果对其声明的变量进行了写操作，JVM就会向处理器发送一条指令，将这个变量所在的缓存行数据写回到主内存。基于缓存一致性协议，其他线程去读取时，就要强制从主内存中读取。在数组进行扩容时可以保证可见性。

对存储的节点Node的元素val以及指针next也是用volatile进行修饰的，再、在多线程环境下对他们进行改变对其他线程也是可见的。

进一步说，ConcurrentHashMap的读性能好，正是因为读取路径大多数时候都不需要参与桶级互斥：

普通桶节点：直接遍历链表读取
ForwardingNode：说明正在扩容，跳转到nextTable继续找
TreeBin：走树形查找逻辑

也就是说，读取线程更多依赖的是volatile可见性和节点结构设计，而不是像传统整表同步容器那样把读操作也放进同一把大锁里。

常见误区

ConcurrentHashMap线程安全，并不代表所有复合操作天然线程安全。像“先判断再更新”这种多步逻辑，仍然需要额外同步或使用更高层原子方法。
ConcurrentHashMap不允许key或value为null，这是为了避免在并发语义里把“key不存在”和“value就是null”混淆。
在高并发更新场景下，size()更适合作为统计观察值，不适合拿来做严格的同步判断或业务条件控制。

引用参考

Java7/8 中的 HashMap 和 ConcurrentHashMap 全解析

深入浅出ConcurrentHashMap1.8

ConcurrentHashMap&HashTable

#数据结构

数据结构--ConcurrentHashMap原理及解析

https://leo-wxy.github.io/2019/01/16/Java-ConcurrentHashMap原理及解析/

作者

Leo-Wxy

发布于

2019年1月16日

许可协议

数据结构--CopyOnWriteArrayList实现原理及简析上一篇

数据结构--ArrayList实现原理及简析下一篇