Java的同步容器和并发容器-蒲公英云

前言：

之前在介绍Java集合的时候说到，java提供的实现类很少是线程安全的。只有几个比较古老的类，比如Vector、Hashtable等是线程安全的，尤其是Hashtable，古老到连命名规范都没统一了……

同步容器：

1）Vector和Hashtable

来简单比较下：

Hashtable和Vector实现同步的方式也很类似，都是使用synchronized关键字，利用java的内置锁来实现。那些新增的线程不安全的，如果实现线程安全呢？

public class Hashtable<K,V> extends Dictionary<K,V> implements Map<K,V>, Cloneable, java.io.Serializable { 
 public synchronized int size() {
      ...
    }
 public synchronized V get(Object key) {
    ...
}

2）synchronized.XXX

介绍一个工具类Collections，其中对各种类型的集合进行了封装，实现了线程安全。

这里写图片描述

以其中的SynchronizedList为例，可以看到也是用的synchronized关键字来实现的。

注意：SynchronizedList并不是对某个实现类的封装，而面对的是List接口。

static class SynchronizedList<E> extends SynchronizedCollection<E> implements List<E> { 
        private static final long serialVersionUID = -7754090372962971524L;
        final List<E> list;
        SynchronizedList(List<E> list) {
            super(list);
            this.list = list;
        }
        SynchronizedList(List<E> list, Object mutex) {
            super(list, mutex);
            this.list = list;
        }
        public boolean equals(Object o) {
            if (this == o)
                return true;
            synchronized (mutex) {
   return list.equals(o);}
        }
        public int hashCode() {
            synchronized (mutex) {
   return list.hashCode();}
        }
        public E get(int index) {
            synchronized (mutex) {
   return list.get(index);}
        }
        public E set(int index, E element) {
            synchronized (mutex) {
   return list.set(index, element);}
        }
        public void add(int index, E element) {
            synchronized (mutex) {list.add(index, element);}
        }
        public E remove(int index) {
            synchronized (mutex) {
   return list.remove(index);}
        }
}

无论是哪一种同步容器，在加锁限制时，都将同步代码块限制在了一个业务合理的最小粒度上。比如：SynchronizedList的get、set、remove等。
首先，需要承认的是这样做是相当合理的。但选择就意味着有利有弊，他不好的地方就是，如果程序需要稍微复杂点的操作，获取最后一个元素或者删除最后一个元素等等。这种情况下，我们就无法再指望人家能给你保证原子性了，就需要你客户端加锁了。

并发容器：

由于同步粒度控制的很小，这就使得容器中的方法都变成串行执行，虽然缓解了高并发，但也使得执行效率降低。高性能、高效率一直是我们追求的功能，为了解决这一点，引出了“并发容器”。

常用的有：ConcurrentHashMap、ConcurrentSkipListMap

并发容器替换同步容器，用很小的风险换得了可扩展性的提高。

在介绍ConcurrentHashMap实现之前，先来了解一下分离锁。

锁分段

如果一个锁中竞争很激烈，我们可以把他拆成两个锁。这样的话，可以通过两个线程并发执行，效果会好一点，但并不明显。

如果把拆分后的所扩展一下，分成可大可小的加锁块的集合，并且他们归属相互独立的对象，这就是我们说的锁分段。

ConcurrentHashMap

ConcurrentHashMap中主要实体类就是三个：ConcurrentHashMap（整个Hash表）,Segment（桶），Node（节点）。（之前的版本中Node叫做 Hash Entry，一个意思。）

每个segment可能包含若干个table数组，每个table也都包含了若干的Node组成的链表。

如图：

这里写图片描述

ConcurrentHashMap使用了一个包含16个锁的Array，每个锁都守护Hash Bucket的十六分之一。更有利于并发访问，减少了锁的请求。

因为不是主要介绍源码，这里就简单的看几个重点的地方：

1、一些重要的变量常量

英文注释说的挺清楚的，就不翻译了，省得翻译还错了。

/** * The default initial table capacity. Must be a power of 2 * (i.e., at least 1) and at most MAXIMUM_CAPACITY. */
    private static final int DEFAULT_CAPACITY = 16;
 /** * The array of bins. Lazily initialized upon first insertion. * Size is always a power of two. Accessed directly by iterators. */
    transient volatile Node<K,V>[] table;
    /** * The next table to use; non-null only while resizing. */
    private transient volatile Node<K,V>[] nextTable;
    /** * Base counter value, used mainly when there is no contention, * but also as a fallback during table initialization * races. Updated via CAS. */
    private transient volatile long baseCount;

2、Segment
继承ReentrantLock 类，说明Segment是可以实现加锁的。

static class Segment<K,V> extends ReentrantLock implements Serializable { 
        private static final long serialVersionUID = 2249069246763182397L;
        final float loadFactor;
        Segment(float lf) { this.loadFactor = lf; }
    }

3、Node类
实现了Map.entry，重写了一个equals和find方法。

static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;
        final K key;
        volatile V val;
        volatile Node<K,V> next;
        Node(int hash, K key, V val, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.val = val;
            this.next = next;
        }
public final boolean equals(Object o) {
            Object k, v, u; Map.Entry<?,?> e;
            return ((o instanceof Map.Entry) &&
                    (k = (e = (Map.Entry<?,?>)o).getKey()) != null &&
                    (v = e.getValue()) != null &&
                    (k == key || k.equals(key)) &&
                    (v == (u = val) || v.equals(u)));
        }
        /** * Virtualized support for map.get(); overridden in subclasses. */
        Node<K,V> find(int h, Object k) {
            Node<K,V> e = this;
            if (k != null) {
                do {
                    K ek;
                    if (e.hash == h &&
                        ((ek = e.key) == k || (ek != null && k.equals(ek))))
                        return e;
                } while ((e = e.next) != null);
            }
            return null;
        }
}

注意：这里使用了volatile关键字，这也是实现线程同步的一种方式，一般而言，可以起到加锁的作用。

4、put()

介绍了这么多，说说他加锁的地方吧。在首次插入的时候，使用cas来保持同步，其他insert、delete、replace等需要使用锁来同步。

CAS : Compare And Swap，一种常用的复合操作。

以put为例：

public V put(K key, V value) {
        return putVal(key, value, false);
    }
    /** Implementation for put and putIfAbsent */
    final V putVal(K key, V value, boolean onlyIfAbsent) {
        //判空校验
        if (key == null || value == null) throw new NullPointerException();
        int hash = spread(key.hashCode());
        int binCount = 0;
        for (Node<K,V>[] tab = table;;) {
            Node<K,V> f; int n, i, fh;
            //延迟初始化
            if (tab == null || (n = tab.length) == 0)
                tab = initTable();
              //首次put添加，不使用锁，而是CAS操作
            else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
                if (casTabAt(tab, i, null,
                             new Node<K,V>(hash, key, value, null)))
                    break;                   // no lock when adding to empty bin
            }
            else if ((fh = f.hash) == MOVED)
                tab = helpTransfer(tab, f);
            else {
            //不是首次put，需要加锁，注意Synchronized锁住的对象时f,即Node
                V oldVal = null;
                synchronized (f) {
                    if (tabAt(tab, i) == f) {
                        if (fh >= 0) {
                            binCount = 1;
                            for (Node<K,V> e = f;; ++binCount) {
                                K ek;
                                //如果已经存在key值，替换掉value
                                if (e.hash == hash &&
                                    ((ek = e.key) == key ||
                                     (ek != null && key.equals(ek)))) {
                                    oldVal = e.val;
                                    if (!onlyIfAbsent)
                                        e.val = value;
                                    break;
                                }
                                Node<K,V> pred = e;
                                //如果不存在key值，创建一个Node
                                if ((e = e.next) == null) {
                                    pred.next = new Node<K,V>(hash, key,
                                                              value, null);
                                    break;
                                }
                            }
                        }
                        else if (f instanceof TreeBin) {
                            Node<K,V> p;
                            binCount = 2;
                            if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                           value)) != null) {
                                oldVal = p.val;
                                if (!onlyIfAbsent)
                                    p.val = value;
                            }
                        }
                    }
                }
                if (binCount != 0) {
                    if (binCount >= TREEIFY_THRESHOLD)
                        treeifyBin(tab, i);
                    if (oldVal != null)
                        return oldVal;
                    break;
                }
            }
        }
        addCount(1L, binCount);
        return null;
    }

不足之处：

正因为锁细化的太好了，如果你要想独占互斥访问的话，那就很难的，付出的成本是很高的。

为了稍稍改变一下这方面被动的局势，ConcurrentHashMap对一些常用的复合操作进行了封装，比如：“相等便替换”，“没有就添加”等等，如果使用同步集合，需要程序员自己加锁控制，这里就直接给写好了。

这里写图片描述

感受：

随着jdk不断更新，java一直在探索中，不断完善和改进。比如java2对集合的变动，java5对线程的扩展等等。在改进的过程中，也在不断参考C、C++更重语言的精华思想。当然，在借鉴的同时，他要保持java这门语言的设计原则和初衷。如果二者出现冲突，那么他肯定是不会借鉴的，或者借鉴一个皮毛的东西。

行了，不扯了。其实就是想说一点，如果之前的设计很不错，那么后期就不会进行特别大的完善，都是修修补补，类似改个bug什么的。同理，如果后面进行了很大的补充或者修改，那么之前的缺点肯定是多到不行了。新的设计也许有缺点，但相比之前，一定是利大于弊。

因此，如果想知道自己对一个知识点掌握的如何时，不妨试试能不能把他的演变历史讲出来，如果又蒙又猜，自己能说服自己的话，就很差不多了，剩下的就是去看书查阅资料验证自己的猜想吧！