排序算法——归并排序

小鱼儿 2022-11-18 01:41 372阅读 0赞

引言

归并排序可以使用递归或迭代的方式来实现,时间复杂度是都是 O(N * logN)。

归并排序的核心是将待排序数组分组,可以整体二分,也可以设置步长迭代切分。归并排序在操作过程中,充分利用了上一次排序的结果,而 O(N ^ 2)的排序算法每次比较都是独立的,简单的说就是,上一次的比较行为完全和下次比较行为无关,这在一定程度上浪费了比较的既得结果。

一、递归实现

不论是递归还是迭代,归并排序最重要的部分是实现两个分组的归并,在归并的过程中同时做好排序

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3UwMTQ3NDUwNjk_size_16_color_FFFFFF_t_70

整个过程可以分为两个大的部分:迭代过程、归并过程。

1、迭代的过程,可以简单思考一个操作步骤:将数组二分,然后合并。如果循环二分,那么一定存在一个条件,只剩1个元素,此时无法再继续二分,直接返回:

  1. public static void process(int[] arr, int L, int R) {
  2. if (L == R)
  3. return;
  4. // 防止整型越界的二分方法,逻辑上等同于 (L + R)/2
  5. int mid = L + ((R - L) >> 1);
  6. process(arr, L, mid);
  7. process(arr, mid + 1, R);
  8. merge(arr, L, mid, R);
  9. }

2、归并的过程,需要一个暂存数组,来存放有序的既得结果,merge(…)方法接收原始数组和 3 个指针,分别是左右两组的外侧边界,以及中点位置。

p1和p2分别指向两组的最左侧,当p1和p2在各自组内未超过最右边界 M 和 R 时,取较小值放入到 help 暂存数组中。当然,左右两组一定会有一个指针先达到最右边界,并由于自加操作跳出第一个 while 循环,而另一个分组还有未拷贝的元素,此时只需要判断哪个分组还有数据,并依次直接拷贝即可,这样就完成了一次归并操作,最后再将暂存数组中排好序的元素放回到原数组即可:

  1. public static void merge(int[] arr, int L, int M, int R) {
  2. int[] help = new int[R - L + 1];
  3. int i = 0;
  4. int p1 = L;
  5. int p2 = M + 1;
  6. while (p1 <= M && p2 <= R) {
  7. help[i++] = arr[p1] < arr[p2] ? arr[p1++] : arr[p2++];
  8. }
  9. // 要么p1越界了,要么p2越界了
  10. while (p1 <= M) {
  11. help[i++] = arr[p1++];
  12. }
  13. while (p2 <= R) {
  14. help[i++] = arr[p2++];
  15. }
  16. for (i = 0; i < help.length; i++) {
  17. arr[L + i] = help[i];
  18. }
  19. }

完整代码如下:

  1. /**
  2. * 递归方式
  3. *
  4. * @param arr
  5. */
  6. public static void mergeSort(int[] arr) {
  7. if (arr == null || arr.length < 2)
  8. return;
  9. process(arr, 0, arr.length - 1);
  10. }
  11. public static void process(int[] arr, int L, int R) {
  12. if (L == R)
  13. return;
  14. int mid = L + ((R - L) >> 1);
  15. process(arr, L, mid);
  16. process(arr, mid + 1, R);
  17. merge(arr, L, mid, R);
  18. }
  19. public static void merge(int[] arr, int L, int M, int R) {
  20. int[] help = new int[R - L + 1];
  21. int i = 0;
  22. int p1 = L;
  23. int p2 = M + 1;
  24. while (p1 <= M && p2 <= R) {
  25. help[i++] = arr[p1] < arr[p2] ? arr[p1++] : arr[p2++];
  26. }
  27. // 要么p1越界了,要么p2越界了
  28. while (p1 <= M) {
  29. help[i++] = arr[p1++];
  30. }
  31. while (p2 <= R) {
  32. help[i++] = arr[p2++];
  33. }
  34. for (i = 0; i < help.length; i++) {
  35. arr[L + i] = help[i];
  36. }
  37. }

二、迭代实现

迭代实现的方式相较于递归的方式要考虑更多的边界条件,归并的过程都是一样的,只是在循环的时候,需要考虑步长的变化,以及剩余元素是否足够分组的问题。

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3UwMTQ3NDUwNjk_size_16_color_FFFFFF_t_70 1

原始数组的长度是关键

以下是完整代码:

  1. /**
  2. * 非递归方式
  3. */
  4. public static void mergeSort2(int[] arr) {
  5. if (arr == null || arr.length < 2)
  6. return;
  7. int N = arr.length;
  8. // 步长,表示的是归并操作一个组里面元素的个数
  9. int mergeSize = 1;
  10. // 由于归并排序需要分为两组,因此,如果mergeSize>=N,
  11. // 那就只有一组或连一组都凑不够,因此就停止merge
  12. while (mergeSize < N) {
  13. int L = 0;
  14. while (L < N) {
  15. if (mergeSize >= N - L) {
  16. break;
  17. }
  18. int M = L + mergeSize - 1;
  19. int R = M + Math.min(mergeSize, N - M - 1);
  20. merge(arr, L, M, R);
  21. L = R + 1;
  22. }
  23. // 防止移除
  24. if (mergeSize > N / 2)
  25. break;
  26. // 步长自增2倍
  27. mergeSize <<= 1;
  28. }
  29. }

三、归并排序的时间复杂度

对迭代方式实现的归并排序来说,使用master公式,具备以下时间消耗形式:

T(N) = 2 * T(N/2) + O(N),a = 2,b = 2,d = 1

那么根据 master 公式,因为 logb a = log2 = 1 与 d = 1 相等,因此最终的时间复杂度为:

O(N^d * logN) = O(N * logN)

对迭代方式实现的归并排序来说,步长调整的过程是 1 -> 2 -> 4 -> 8…,当步长超过 N 后即停止增长,因此它的变化次数就是 logN,而相邻两组 merge ,需要将整个数组重新merge一遍。

每次步长调整后都要将整个数组 merge 一遍,因此就是 O(N * logN)。

四、测试与对数器

  1. // for test
  2. public static int[] generateRandomArray(int maxSize, int maxValue) {
  3. int[] arr = new int[(int) ((maxSize + 1) * Math.random())];
  4. for (int i = 0; i < arr.length; i++) {
  5. arr[i] = (int) ((maxValue + 1) * Math.random()) - (int) (maxValue * Math.random());
  6. }
  7. return arr;
  8. }
  9. // for test
  10. public static int[] copyArray(int[] arr) {
  11. if (arr == null) {
  12. return null;
  13. }
  14. int[] res = new int[arr.length];
  15. for (int i = 0; i < arr.length; i++) {
  16. res[i] = arr[i];
  17. }
  18. return res;
  19. }
  20. // for test
  21. public static boolean isEqual(int[] arr1, int[] arr2) {
  22. if ((arr1 == null && arr2 != null) || (arr1 != null && arr2 == null)) {
  23. return false;
  24. }
  25. if (arr1 == null && arr2 == null) {
  26. return true;
  27. }
  28. if (arr1.length != arr2.length) {
  29. return false;
  30. }
  31. for (int i = 0; i < arr1.length; i++) {
  32. if (arr1[i] != arr2[i]) {
  33. return false;
  34. }
  35. }
  36. return true;
  37. }
  38. // for test
  39. public static void printArray(int[] arr) {
  40. if (arr == null) {
  41. return;
  42. }
  43. for (int i = 0; i < arr.length; i++) {
  44. System.out.print(arr[i] + " ");
  45. }
  46. System.out.println();
  47. }
  48. // for test
  49. public static void main(String[] args) {
  50. int testTime = 500000;
  51. int maxSize = 100;
  52. int maxValue = 100;
  53. System.out.println("测试开始");
  54. for (int i = 0; i < testTime; i++) {
  55. int[] arr1 = generateRandomArray(maxSize, maxValue);
  56. int[] arr2 = copyArray(arr1);
  57. mergeSort(arr1);
  58. mergeSort2(arr2);
  59. if (!isEqual(arr1, arr2)) {
  60. System.out.println("出错了!");
  61. printArray(arr1);
  62. printArray(arr2);
  63. break;
  64. }
  65. }
  66. System.out.println("测试结束");
  67. }

总结

归并排序通过保留比较结果的方式将 O(N^2)的排序算法时间复杂度提升到了 O(N * logN) 。

merge()方法是归并排序的关键,它的逻辑是将元素分为左右两组,两组元素逐一比较,将小的元素拷贝到临时数组中。

两种方式——递归、迭代,其本质都是从 1 比 1,到 2 比 2,到 4 比 4 …,迭代的方式直接是设置了初始步长为1,而迭代的方式是先将数组层层二分,其实分到最后也一定会出现 1 比 1的情况,即 L == R,再层层返回,实际上也是从 1 比 1开始,再 2 比 2 ,最后整个数组的左右两组做比较进行归并。

递归的方式很明显简化了编码过程,但一定要注意 base case 的返回条件。迭代的方式除了要考虑步长的变化规则,还要分析当数组剩余元素不够左组的情况,需要如何处理,以及在步长 * 2 前先判断是否有越界的风险,因为一旦越界(Integer.maxValue),步长可能会变为负数,造成死循环。

发表评论

表情:
评论列表 (有 0 条评论,372人围观)

还没有评论,来说两句吧...

相关阅读

    相关 排序算法——归并排序

    引言 归并排序可以使用递归或迭代的方式来实现,时间复杂度是都是 O(N \ logN)。 归并排序的核心是将待排序数组分组,可以整体二分,也可以设置步长迭代切分。归并排

    相关 排序算法-归并排序

    归并排序也是一个比较快速的排序算法,其思想是运用分治的思想,先对要排序的数进行分,每次从中间分成两部分,然后知道分成最小,然后在把他们合起来,边合起来边排序,最后有序,每次分的

    相关 排序算法——归并排序

    前言 将待排序序列R\[0...n-1\]看成是n个长度为1的有序序列,将相邻的有序表成对归并,得到n/2个长度为2的有序表;将这些有序序列再次归并,得到n/4个长度为4

    相关 排序算法归并排序

    一、前言     归并排序是建立在归并操作上的一种有效的排序算法,该算法是采用 分治法(Divide and Conquer) 的一个非常典型的应用。 --------