集合篇-ConcurrentHashMap
阅读原文时间:2023年07月08日阅读:1

点赞再看,养成习惯,微信搜索「小大白日志」关注这个搬砖人。

文章不定期同步公众号,还有各种一线大厂面试原题、我的学习系列笔记。

jdk1.7和jdk1.8中ConcurrentHashMap的区别?

底层数据结构的区别
  • jdk1.7中的ConcurrenHashMap的底层结构=Segment数组+HashEntry数组来实现,put过程使用了Synchronized,结构如下:

    由上,jdk1.7中ConcurretHashMap=Segment类数组,每个Segment元素=HashEntry类数组=类似一个hashMap结构,每个HashEntry元素=链表;当多线程并发时,锁住的是单个Segment元素(Segment继承ReentrantLock,此处jdk1.7使用的是ReentrantLock的非公平锁),但即使是单个Segment元素,里面也含有一整个HashEntry数组(类似一个HashMap),所以锁住的是一整个HashEntry数组,故并发度也没有那么高

  • jdk1.8中的ConcurrenHashMap的底层结构=Node数组+链表+红黑树,put过程使用了Synchronized+CAS(调用Unsafe类的cas方法),结构如下:

由上,jdk1.8中ConcurretHashMap类似于HashMap,它们都是数组+链表+红黑树,所有的操作都一样,唯一区别是ConcurretHashMap在具体某个桶的位置插入元素时,该位置的链表或红黑树会被同步访问【Synchronized(某桶的头节点)】,这样粒度比jdk1.7的更小了,锁住的是某个链表(或红黑树)

put方法的区别
  • jdk1.7中的put需定位两次:先定位要插入的元素在segment数组的下标,然后加锁去根据这个下标定位HashEntry数组的下标【key的hash值&HashEntry数组长度】,没有获得锁的线程做一些准备工作:

    (1)提前找好HashEntry中桶的位置;

    (2)遍历该桶有没有相同的key

    进行(1)、(2)的同时不断自旋获取锁,超过64次还没获取到锁就挂起该线程

  • jdk1.8中的put只需定位一次:

-->假如Node型table数组为空则初始化initTable()

-->table初始化完成,定位要插入元素所在的table[i]的位置,进一步判断table[i]为空则执行cas插入;

-->table[i]不为空且table[i].hash=-1,代表ConcurrentHashMap正在扩容,则加入扩容;

-->table[i].hash不为-1则直接插入,若是链表则插入到链表尾,若是红黑树则插入到红黑树

短时间内如何将大量数据高效地插入到ConcucurentHashMap?

以jdk1.8为例,影响concurrentHashMap插入元素的效率主要有两点:插入时频繁地扩容+插入时并发地访问:

(1)解决‘插入时频繁地扩容’:需选择合适的初始化容量和扩容因子

(2)解决‘插入时并发地访问’:插入节点时会对Node链表头节点加锁,然而锁也有'偏向锁…重量级锁',只要控制锁不发生升级,尽量保持在偏向锁状态,这样每个桶就只有一个线程访问,不会发生高并发从而提高插入效率。如何保持每个头结点加锁之后都是'偏向锁'状态呢?利用concurrentHashMap的spread()方法求key的hash值(预处理数据),将存在哈希冲突的key都集中地插入某个桶(可能会有多个桶-多个哈希冲突),因为每个桶都用单线程去put,从而没有其他线程去竞争同一个桶的锁,锁就一直为‘偏向锁’。

jdk1.8的put源码

final V putVal(K key, V value, boolean onlyIfAbsent) {  //onlyIfAbsent默认传入false
        if (key == null || value == null) throw new NullPointerException();
        int hash = spread(key.hashCode());  //求key的hash值=预处理hashcode:便于将存在哈希冲突的key集中地插入某个桶
        int binCount = 0;
        for (Node<K,V>[] tab = table;;) {
            Node<K,V> f; int n, i, fh;
            if (tab == null || (n = tab.length) == 0)  //如果table为空则初始化数组
                tab = initTable();
            else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) { //如果table非空则检查插入位置table[i]处的位置是否为空,若是则用cas插入Node节点
                if (casTabAt(tab, i, null,
                             new Node<K,V>(hash, key, value, null)))
                    break;                   // no lock when adding to empty bin
            }
            else if ((fh = f.hash) == MOVED)  //如果插入位置table[i]的头结点f的【hash值=fh】为-1则代表concurrentHashMap正在扩容,则加入扩容
                tab = helpTransfer(tab, f);
            else {
                V oldVal = null;
                synchronized (f) {  //以上情况都不是,则插入到链表或红黑树,该步直接把头结点synchronized加锁,这样锁住的就是单个链表或单个红黑树
                    if (tabAt(tab, i) == f) {
                        if (fh >= 0) {//判断该桶位置处是链表还是红黑树:头结点的hash值>=,代表该处是链表
                            binCount = 1;
                            for (Node<K,V> e = f;; ++binCount) { //binCount用于计算该链表的结点树,后面会用到判断binCount>8则转为红黑树
                                K ek;
                                if (e.hash == hash &&
                                    ((ek = e.key) == key ||
                                     (ek != null && key.equals(ek)))) {//key相同
                                    oldVal = e.val;
                                    if (!onlyIfAbsent)  //onlyIfAbsent默认为false
                                        e.val = value;
                                    break;
                                }
                                Node<K,V> pred = e;
                                if ((e = e.next) == null) {  //插入到链表尾
                                    pred.next = new Node<K,V>(hash, key,
                                                              value, null);
                                    break;
                                }
                            }
                        }
                        else if (f instanceof TreeBin) {
                            Node<K,V> p;
                            binCount = 2;
                            if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                           value)) != null) {
                                oldVal = p.val;
                                if (!onlyIfAbsent)
                                    p.val = value;
                            }
                        }
                    }
                }
                if (binCount != 0) {
                    if (binCount >= TREEIFY_THRESHOLD)  //TREEIFY_THRESHOLD默认8,判断链表结点数>=8则转为红黑树
                        treeifyBin(tab, i);
                    if (oldVal != null)
                        return oldVal;
                    break;
                }
            }
        }
        addCount(1L, binCount);
        return null;
    }

    //Node型数组table为空时,初始化
    private final Node<K,V>[] initTable() {
        Node<K,V>[] tab; int sc;
        while ((tab = table) == null || tab.length == 0) {
        //sizeCtl默认为0,可有三种取值:-1代表table正被其他线程初始化;0代表table等待初始化;大于0代表table初始化完成
            if ((sc = sizeCtl) < 0)
                Thread.yield(); // -1代表table正被其他线程初始化,本线程让出时间片进入就绪状态
            else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) { //SIZECTL默认为0:【this在SIZECTL偏移量处的值=默认0】与sc相比,若相等则将this在SIZECTL偏移量处的值置为-1,代表table正在被初始化【疑问:sizeCtl是不同于SIZECTL的,SIZECTL=-1但sizeCtl没有置-1,所以上面Thread.yield()应该永远执行不到?】
                try {
                    if ((tab = table) == null || tab.length == 0) {
                        int n = (sc > 0) ? sc : DEFAULT_CAPACITY;//sc默认为0,DEFAULT_CAPACITY=默认16
                        @SuppressWarnings("unchecked")
                        Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                        table = tab = nt;
                        sc = n - (n >>> 2);  //n=16,n >>> 2即n/4,所以sc=n-(n/4)=3n/4=0.75n=12
                    }
                } finally {
                    sizeCtl = sc;  //把sizeCtl置为12>0,代表table初始化完成
                }
                break;
            }
        }
        return tab;
    }

OK,如果文章哪里有错误或不足,欢迎各位留言。

创作不易,各位的「三连」是二少创作的最大动力!我们下期见!