Java同步容器和并发容器

一时失言乱红尘 2024-03-17 13:45 171阅读 0赞

同步容器

在 Java 中,同步容器主要包括 2 类:

  • Vector、Stack、HashTable

    • Vector 实现了 List 接口,Vector 实际上就是一个数组,和 ArrayList 类似,但是 Vector 中的方法都是 synchronized 方法,即进行了同步措施。
    • Stack 也是一个同步容器,它的方法也用 synchronized 进行了同步,它实际上是继承于 Vector 类。
    • HashTable 实现了 Map 接口,它和 HashMap 很相似,但是 HashTable 进行了同步处理,而 HashMap 没有。
  • Collections 类中提供的静态工厂方法创建的类(由 Collections.synchronizedXxxx 等方法)

同步容器的缺陷

同步容器的同步原理就是在方法上用 synchronized 修饰。那么,这些方法每次只允许一个线程调用执行。

性能问题

由于被 synchronized 修饰的方法,每次只允许一个线程执行,其他试图访问这个方法的线程只能等待。显然,这种方式比没有使用 synchronized 的容器性能要差。

安全问题

同步容器真的一定安全吗?

答案是:未必。同步容器未必真的安全。在做复合操作时,仍然需要加锁来保护。

常见复合操作如下:

  • 迭代:反复访问元素,直到遍历完全部元素;
  • 跳转:根据指定顺序寻找当前元素的下一个(下 n 个)元素;
  • 条件运算:例如若没有则添加等;

不安全的示例

  1. public class Test {
  2. static Vector<Integer> vector = new Vector<Integer>();
  3. public static void main(String[] args) throws InterruptedException {
  4. while(true) {
  5. for(int i=0;i<10;i++)
  6. vector.add(i);
  7. Thread thread1 = new Thread(){
  8. public void run() {
  9. for(int i=0;i<vector.size();i++)
  10. vector.remove(i);
  11. };
  12. };
  13. Thread thread2 = new Thread(){
  14. public void run() {
  15. for(int i=0;i<vector.size();i++)
  16. vector.get(i);
  17. };
  18. };
  19. thread1.start();
  20. thread2.start();
  21. while(Thread.activeCount()>10) {
  22. }
  23. }
  24. }
  25. }

复制

执行时可能会出现数组越界错误。

Vector 是线程安全的,为什么还会报这个错?很简单,对于 Vector,虽然能保证每一个时刻只能有一个线程访问它,但是不排除这种可能:

当某个线程在某个时刻执行这句时:

  1. for(int i=0;i<vector.size();i++)
  2. vector.get(i);

复制

假若此时 vector 的 size 方法返回的是 10,i 的值为 9

然后另外一个线程执行了这句:

  1. for(int i=0;i<vector.size();i++)
  2. vector.remove(i);

复制

将下标为 9 的元素删除了。

那么通过 get 方法访问下标为 9 的元素肯定就会出问题了。

安全示例

因此为了保证线程安全,必须在方法调用端做额外的同步措施,如下面所示:

  1. public class Test {
  2. static Vector<Integer> vector = new Vector<Integer>();
  3. public static void main(String[] args) throws InterruptedException {
  4. while(true) {
  5. for(int i=0;i<10;i++)
  6. vector.add(i);
  7. Thread thread1 = new Thread(){
  8. public void run() {
  9. synchronized (Test.class) { //进行额外的同步
  10. for(int i=0;i<vector.size();i++)
  11. vector.remove(i);
  12. }
  13. };
  14. };
  15. Thread thread2 = new Thread(){
  16. public void run() {
  17. synchronized (Test.class) {
  18. for(int i=0;i<vector.size();i++)
  19. vector.get(i);
  20. }
  21. };
  22. };
  23. thread1.start();
  24. thread2.start();
  25. while(Thread.activeCount()>10) {
  26. }
  27. }
  28. }
  29. }

复制

ConcurrentModificationException 异常

在对 Vector 等容器并发地进行迭代修改时,会报 ConcurrentModificationException 异常,关于这个异常将会在后续文章中讲述。

但是在并发容器中不会出现这个问题。

并发容器

JDK 的 java.util.concurrent 包(即 juc)中提供了几个非常有用的并发容器。

  • CopyOnWriteArrayList - 线程安全的 ArrayList
  • CopyOnWriteArraySet - 线程安全的 Set,它内部包含了一个 CopyOnWriteArrayList,因此本质上是由 CopyOnWriteArrayList 实现的。
  • ConcurrentSkipListSet - 相当于线程安全的 TreeSet。它是有序的 Set。它由 ConcurrentSkipListMap 实现。
  • ConcurrentHashMap - 线程安全的 HashMap。采用分段锁实现高效并发。
  • ConcurrentSkipListMap - 线程安全的有序 Map。使用跳表实现高效并发。
  • ConcurrentLinkedQueue - 线程安全的无界队列。底层采用单链表。支持 FIFO。
  • ConcurrentLinkedDeque - 线程安全的无界双端队列。底层采用双向链表。支持 FIFO 和 FILO。
  • ArrayBlockingQueue - 数组实现的阻塞队列。
  • LinkedBlockingQueue - 链表实现的阻塞队列。
  • LinkedBlockingDeque - 双向链表实现的双端阻塞队列。

ConcurrentHashMap

要点
  • 作用:ConcurrentHashMap 是线程安全的 HashMap。
  • 原理:JDK6 与 JDK7 中,ConcurrentHashMap 采用了分段锁机制。JDK8 中,摒弃了锁分段机制,改为利用 CAS 算法。
源码

JDK7

ConcurrentHashMap 类在 jdk1.7 中的设计,其基本结构如图所示:

9ba8d6e215a0a14ef21191352d74b0fb.jpeg

每一个 segment 都是一个 HashEntry[] table, table 中的每一个元素本质上都是一个 HashEntry 的单向队列。比如 table[3]为首节点,table[3]->next 为节点 1,之后为节点 2,依次类推。

  1. public class ConcurrentHashMap<K, V> extends AbstractMap<K, V>
  2. implements ConcurrentMap<K, V>, Serializable {
  3. // 将整个hashmap分成几个小的map,每个segment都是一个锁;与hashtable相比,这么设计的目的是对于put, remove等操作,可以减少并发冲突,对
  4. // 不属于同一个片段的节点可以并发操作,大大提高了性能
  5. final Segment<K,V>[] segments;
  6. // 本质上Segment类就是一个小的hashmap,里面table数组存储了各个节点的数据,继承了ReentrantLock, 可以作为互拆锁使用
  7. static final class Segment<K,V> extends ReentrantLock implements Serializable {
  8. transient volatile HashEntry<K,V>[] table;
  9. transient int count;
  10. }
  11. // 基本节点,存储Key, Value值
  12. static final class HashEntry<K,V> {
  13. final int hash;
  14. final K key;
  15. volatile V value;
  16. volatile HashEntry<K,V> next;
  17. }
  18. }

复制

JDK8

  • jdk8 中主要做了 2 方面的改进
  • 取消 segments 字段,直接采用 transient volatile HashEntry<K,V>[] table 保存数据,采用 table 数组元素作为锁,从而实现了对每一行数据进行加锁,进一步减少并发冲突的概率。
  • 将原先 table 数组+单向链表的数据结构,变更为 table 数组+单向链表+红黑树的结构。对于 hash 表来说,最核心的能力在于将 key hash 之后能均匀的分布在数组中。如果 hash 之后散列的很均匀,那么 table 数组中的每个队列长度主要为 0 或者 1。但实际情况并非总是如此理想,虽然 ConcurrentHashMap 类默认的加载因子为 0.75,但是在数据量过大或者运气不佳的情况下,还是会存在一些队列长度过长的情况,如果还是采用单向列表方式,那么查询某个节点的时间复杂度为 O(n);因此,对于个数超过 8(默认值)的列表,jdk1.8 中采用了红黑树的结构,那么查询的时间复杂度可以降低到 O(logN),可以改进性能。

    final V putVal(K key, V value, boolean onlyIfAbsent) {

    1. if (key == null || value == null) throw new NullPointerException();
    2. int hash = spread(key.hashCode());
    3. int binCount = 0;
    4. for (Node<K,V>[] tab = table;;) {
    5. Node<K,V> f; int n, i, fh;
    6. // 如果table为空,初始化;否则,根据hash值计算得到数组索引i,如果tab[i]为空,直接新建节点Node即可。注:tab[i]实质为链表或者红黑树的首节点。
    7. if (tab == null || (n = tab.length) == 0)
    8. tab = initTable();
    9. else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
    10. if (casTabAt(tab, i, null,
    11. new Node<K,V>(hash, key, value, null)))
    12. break; // no lock when adding to empty bin
    13. }
    14. // 如果tab[i]不为空并且hash值为MOVED,说明该链表正在进行transfer操作,返回扩容完成后的table。
    15. else if ((fh = f.hash) == MOVED)
    16. tab = helpTransfer(tab, f);
    17. else {
    18. V oldVal = null;
    19. // 针对首个节点进行加锁操作,而不是segment,进一步减少线程冲突
    20. synchronized (f) {
    21. if (tabAt(tab, i) == f) {
    22. if (fh >= 0) {
    23. binCount = 1;
    24. for (Node<K,V> e = f;; ++binCount) {
    25. K ek;
    26. // 如果在链表中找到值为key的节点e,直接设置e.val = value即可。
    27. if (e.hash == hash &&
    28. ((ek = e.key) == key ||
    29. (ek != null && key.equals(ek)))) {
    30. oldVal = e.val;
    31. if (!onlyIfAbsent)
    32. e.val = value;
    33. break;
    34. }
    35. // 如果没有找到值为key的节点,直接新建Node并加入链表即可。
    36. Node<K,V> pred = e;
    37. if ((e = e.next) == null) {
    38. pred.next = new Node<K,V>(hash, key,
    39. value, null);
    40. break;
    41. }
    42. }
    43. }
    44. // 如果首节点为TreeBin类型,说明为红黑树结构,执行putTreeVal操作。
    45. else if (f instanceof TreeBin) {
    46. Node<K,V> p;
    47. binCount = 2;
    48. if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
    49. value)) != null) {
    50. oldVal = p.val;
    51. if (!onlyIfAbsent)
    52. p.val = value;
    53. }
    54. }
    55. }
    56. }
    57. if (binCount != 0) {
    58. // 如果节点数>=8,那么转换链表结构为红黑树结构。
    59. if (binCount >= TREEIFY_THRESHOLD)
    60. treeifyBin(tab, i);
    61. if (oldVal != null)
    62. return oldVal;
    63. break;
    64. }
    65. }
    66. }
    67. // 计数增加1,有可能触发transfer操作(扩容)。
    68. addCount(1L, binCount);
    69. return null;

    }

复制

示例
  1. public class ConcurrentHashMapDemo {
  2. public static void main(String[] args) throws InterruptedException {
  3. // HashMap 在并发迭代访问时会抛出 ConcurrentModificationException 异常
  4. // Map<Integer, Character> map = new HashMap<>();
  5. Map<Integer, Character> map = new ConcurrentHashMap<>();
  6. Thread wthread = new Thread(() -> {
  7. System.out.println("写操作线程开始执行");
  8. for (int i = 0; i < 26; i++) {
  9. map.put(i, (char) ('a' + i));
  10. }
  11. });
  12. Thread rthread = new Thread(() -> {
  13. System.out.println("读操作线程开始执行");
  14. for (Integer key : map.keySet()) {
  15. System.out.println(key + " - " + map.get(key));
  16. }
  17. });
  18. wthread.start();
  19. rthread.start();
  20. Thread.sleep(1000);
  21. }
  22. }

复制

CopyOnWriteArrayList

要点
  • 作用:CopyOnWrite 字面意思为写入时复制。CopyOnWriteArrayList 是线程安全的 ArrayList。
  • 原理:

    • 在 CopyOnWriteAarrayList 中,读操作不同步,因为它们在内部数组的快照上工作,所以多个迭代器可以同时遍历而不会相互阻塞(1,2,4)。
    • 所有的写操作都是同步的。他们在备份数组(3)的副本上工作。写操作完成后,后备阵列将被替换为复制的阵列,并释放锁定。支持数组变得易变,所以替换数组的调用是原子(5)。
    • 写操作后创建的迭代器将能够看到修改的结构(6,7)。
    • 写时复制集合返回的迭代器不会抛出 ConcurrentModificationException,因为它们在数组的快照上工作,并且无论后续的修改(2,4)如何,都会像迭代器创建时那样完全返回元素。

1cf19086ca2981a73f65c45f35f1041e.jpeg

源码

重要属性

  • lock - 执行写时复制操作,需要使用可重入锁加锁
  • array - 对象数组,用于存放元素

    /* The lock protecting all mutators /

    1. final transient ReentrantLock lock = new ReentrantLock();
    2. /** The array, accessed only via getArray/setArray. */
    3. private transient volatile Object[] array;

复制

重要方法

  • 添加操作

    • 添加的逻辑很简单,先将原容器 copy 一份,然后在新副本上执行写操作,之后再切换引用。当然此过程是要加锁的。

    public boolean add(E e) {

    1. //ReentrantLock加锁,保证线程安全
    2. final ReentrantLock lock = this.lock;
    3. lock.lock();
    4. try {
    5. Object[] elements = getArray();
    6. int len = elements.length;
    7. //拷贝原容器,长度为原容器长度加一
    8. Object[] newElements = Arrays.copyOf(elements, len + 1);
    9. //在新副本上执行添加操作
    10. newElements[len] = e;
    11. //将原容器引用指向新副本
    12. setArray(newElements);
    13. return true;
    14. } finally {
    15. //解锁
    16. lock.unlock();
    17. }

    }

复制

  • 删除操作

    • 删除操作同理,将除要删除元素之外的其他元素拷贝到新副本中,然后切换引用,将原容器引用指向新副本。同属写操作,需要加锁。

    public E remove(int index) {

    1. //加锁
    2. final ReentrantLock lock = this.lock;
    3. lock.lock();
    4. try {
    5. Object[] elements = getArray();
    6. int len = elements.length;
    7. E oldValue = get(elements, index);
    8. int numMoved = len - index - 1;
    9. if (numMoved == 0)
    10. //如果要删除的是列表末端数据,拷贝前len-1个数据到新副本上,再切换引用
    11. setArray(Arrays.copyOf(elements, len - 1));
    12. else {
    13. //否则,将除要删除元素之外的其他元素拷贝到新副本中,并切换引用
    14. Object[] newElements = new Object[len - 1];
    15. System.arraycopy(elements, 0, newElements, 0, index);
    16. System.arraycopy(elements, index + 1, newElements, index,
    17. numMoved);
    18. setArray(newElements);
    19. }
    20. return oldValue;
    21. } finally {
    22. //解锁
    23. lock.unlock();
    24. }

    }

复制

  • 读操作

    • CopyOnWriteArrayList 的读操作是不用加锁的,性能很高。

    public E get(int index) {

    1. return get(getArray(), index);

    }
    private E get(Object[] a, int index) {

    1. return (E) a[index];

    }

复制

示例
  1. public class CopyOnWriteArrayListDemo {
  2. static class ReadTask implements Runnable {
  3. List<String> list;
  4. ReadTask(List<String> list) {
  5. this.list = list;
  6. }
  7. public void run() {
  8. for (String str : list) {
  9. System.out.println(str);
  10. }
  11. }
  12. }
  13. static class WriteTask implements Runnable {
  14. List<String> list;
  15. int index;
  16. WriteTask(List<String> list, int index) {
  17. this.list = list;
  18. this.index = index;
  19. }
  20. public void run() {
  21. list.remove(index);
  22. list.add(index, "write_" + index);
  23. }
  24. }
  25. public void run() {
  26. final int NUM = 10;
  27. // ArrayList 在并发迭代访问时会抛出 ConcurrentModificationException 异常
  28. // List<String> list = new ArrayList<>();
  29. CopyOnWriteArrayList<String> list = new CopyOnWriteArrayList<>();
  30. for (int i = 0; i < NUM; i++) {
  31. list.add("main_" + i);
  32. }
  33. ExecutorService executorService = Executors.newFixedThreadPool(NUM);
  34. for (int i = 0; i < NUM; i++) {
  35. executorService.execute(new ReadTask(list));
  36. executorService.execute(new WriteTask(list, i));
  37. }
  38. executorService.shutdown();
  39. }
  40. public static void main(String[] args) {
  41. new CopyOnWriteArrayListDemo().run();
  42. }
  43. }

发表评论

表情:
评论列表 (有 0 条评论,171人围观)

还没有评论,来说两句吧...

相关阅读

    相关 同步容器并发容器及使用

    1.什么是同步容器?同步容器使用什么方式实现线程安全 同步容器 可以简单的理解位通过synchronized来实现同步的容器,如果有多个线程调用同步容器的方法,它们将会串行执