algorithms/sorting/mergesort/merge_sort.cpp at main · microwind/algorithms · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
/**
 * Copyright © https://github.com/microwind All rights reserved.
 *
 * @author: jarryli@gmail.com
 * @version: 1.0
 */

/**
 * 归并排序算法实现
 * 提供五种不同的实现方式，适合不同场景和性能需求
 */

#include <iostream>
#include <vector>
#include <chrono>
#include <iomanip>

using namespace std;
using namespace std::chrono;

// 函数声明
void printArray(const vector<int>& arr, const string& label);
void performanceTest(function<void(vector<int>&, int, int)> sortFunc, vector<int>& arr, int size, const string& name);
void merge(vector<int>& arr, int left, int mid, int right);
void mergeInPlace(vector<int>& arr, int left, int mid, int right);
void mergeInPlaceRange(vector<int>& arr, int left, int mid, int right);
void mergeIterative(vector<int>& arr, vector<int>& temp, int left, int mid, int right);
void mergeBottomUp(vector<int>& arr, vector<int>& temp, int left, int mid, int right);

// 主要排序函数声明
void mergeSort1(vector<int>& arr, int left, int right);
void mergeSort2(vector<int>& arr, int left, int right);
void mergeSort3(vector<int>& arr, int size);
void mergeSort4(vector<int>& arr, int size);
void mergeSort5(vector<int>& arr, int left, int right);

/**
 * 打印数组内容的辅助函数
 */
void printArray(const vector<int>& arr, const string& label)
{
    cout << label << ": [";
    for (size_t i = 0; i < arr.size(); i++)
    {
        cout << arr[i];
        if (i < arr.size() - 1)
        {
            cout << ", ";
        }
    }
    cout << "]" << endl;
}

/**
 * 性能测试辅助函数
 */
void performanceTest(function<void(vector<int>&, int, int)> sortFunc, vector<int>& arr, int size, const string& name)
{
    // 创建数组副本，避免修改原数组
    vector<int> testArr = arr;
    printArray(testArr, name);

    // 开始计时
    auto start = high_resolution_clock::now();
    sortFunc(testArr, 0, size - 1);
    auto end = high_resolution_clock::now();

    auto duration = duration_cast<microseconds>(end - start);
    cout << name << ": " << fixed << setprecision(3) << duration.count() / 1000.0 << "ms" << endl;
    printArray(testArr, "排序后数组");
    cout << endl; // 空行分隔
}

// ==================== 主程序：算法演示和性能测试 ====================

// 测试数据：
vector<int> testData = {7, 11, 9, 10, 12, 13, 8, 5, 6, 1, 3, 2, 4};
int testDataSize = testData.size();

/**
 * 合并两个子数组
 */
void merge(vector<int>& arr, int left, int mid, int right)
{
    // 步骤1：初始化左右子数组长度
    int left_len = mid - left + 1;
    int right_len = right - mid;

    // 步骤2：初始化两个子数组
    vector<int> left_arr(left_len);
    vector<int> right_arr(right_len);

    // 步骤3：复制数据到子数组
    for (int i = 0; i < left_len; i++)
    {
        left_arr[i] = arr[left + i];
    }
    for (int j = 0; j < right_len; j++)
    {
        right_arr[j] = arr[mid + 1 + j];
    }

    // 步骤4：合并两个子数组
    int i = 0, j = 0, idx = left;
    while (i < left_len && j < right_len)
    {
        if (left_arr[i] <= right_arr[j])
        {
            arr[idx] = left_arr[i];
            i++;
        }
        else
        {
            arr[idx] = right_arr[j];
            j++;
        }
        idx++;
    }

    // 步骤5：复制剩余元素
    while (i < left_len)
    {
        arr[idx] = left_arr[i];
        i++;
        idx++;
    }
    while (j < right_len)
    {
        arr[idx] = right_arr[j];
        j++;
        idx++;
    }
}

/**
 * 归并排序基础版本 - 递归实现
 *
 * 算法原理：
 * 1. 将数组递归地分成两半，直到每个子数组只有一个元素
 * 2. 将相邻的两个有序子数组合并成一个更大的有序数组
 * 3. 重复合并过程，直到最终得到一个完全有序的数组
 *
 * 生活类比：就像整理一副扑克牌，先把牌分成两堆，
 * 每堆分别整理好，然后将两堆有序地合并在一起
 *
 * 时间复杂度：O(n log n) - 无论如何都需要O(n log n)次比较
 * 空间复杂度：O(n) - 需要额外的数组空间来存储合并结果
 * 稳定性：稳定 - 合并过程中保持相等元素的相对位置
 */
void mergeSort1(vector<int>& arr, int left, int right)
{
    // 基础情况：当左边界不小于右边界时停止递归
    if (left >= right)
    {
        return;
    }

    // 步骤1：计算中间位置
    // 使用 left + (right - left) / 2 防止整数溢出
    int mid = left + (right - left) / 2;

    // 步骤2：递归排序左半部分
    mergeSort1(arr, left, mid);

    // 步骤3：递归排序右半部分
    mergeSort1(arr, mid + 1, right);

    // 步骤4：合并两个有序子数组
    merge(arr, left, mid, right);
}

/**
 * 原地合并两个有序子数组
 */
void mergeInPlace(vector<int>& arr, int left, int mid, int right)
{
    // 创建临时数组存储左半部分
    int leftSize = mid - left + 1;
    vector<int> leftArr(arr.begin() + left, arr.begin() + mid + 1);

    int i = 0;       // 左数组索引
    int j = mid + 1; // 右数组索引
    int k = left;    // 合并位置索引

    // 合并两个有序子数组
    while (i < leftSize && j <= right)
    {
        if (leftArr[i] <= arr[j])
        {
            arr[k] = leftArr[i];
            i++;
        }
        else
        {
            arr[k] = arr[j];
            j++;
        }
        k++;
    }

    // 复制左数组剩余元素
    while (i < leftSize)
    {
        arr[k] = leftArr[i];
        i++;
        k++;
    }
}

/**
 * 归并排序优化版本 - 原地合并
 *
 * 优化思路：
 * 减少空间复杂度，尝试在原数组上进行合并操作
 * 使用索引操作而不是创建新数组
 *
 * 优化效果：
 * - 减少了内存分配
 * - 提高了空间效率
 *
 * 时间复杂度：O(n log n)
 * 空间复杂度：O(log n) - 仅递归栈空间
 * 稳定性：稳定 - 合并过程中保持相等元素的相对位置
 */
void mergeSort2(vector<int>& arr, int left, int right)
{
    // 基础情况：当左边界不小于右边界时停止递归
    if (left >= right)
    {
        return;
    }

    // 步骤1：计算中间位置
    int mid = (left + right) / 2;

    // 步骤2：递归排序左半部分
    // 处理范围：[left, mid]
    mergeSort2(arr, left, mid);

    // 步骤3：递归排序右半部分
    // 处理范围：[mid+1, right]
    mergeSort2(arr, mid + 1, right);

    // 步骤4：原地合并两个有序部分
    // 关键步骤：在原数组上直接合并相邻的有序子数组
    mergeInPlace(arr, left, mid, right);
}

/**
 * 合并两个有序子数组 - 迭代版本
 */
void mergeIterative(vector<int>& arr, vector<int>& temp, int left, int mid, int right)
{
    int i = left;    // 左子数组索引
    int j = mid + 1; // 右子数组索引
    int k = left;    // 临时数组索引

    // 合并到临时数组
    while (i <= mid && j <= right)
    {
        if (arr[i] <= arr[j])
        {
            temp[k] = arr[i];
            i++;
        }
        else
        {
            temp[k] = arr[j];
            j++;
        }
        k++;
    }

    // 复制左子数组剩余元素
    while (i <= mid)
    {
        temp[k] = arr[i];
        i++;
        k++;
    }

    // 复制右子数组剩余元素
    while (j <= right)
    {
        temp[k] = arr[j];
        j++;
        k++;
    }

    // 将临时数组复制回原数组
    for (i = left; i <= right; i++)
    {
        arr[i] = temp[i];
    }
}

/**
 * 归并排序 - 迭代版本
 *
 * 算法思路：
 * 使用迭代方式代替递归，避免递归栈开销
 * 从小规模合并开始，逐步扩大合并规模
 *
 * 优化效果：
 * - 避免了递归调用的开销
 * - 更好的缓存局部性
 *
 * 时间复杂度：O(n log n)
 * 空间复杂度：O(n) - 需要临时数组
 * 稳定性：稳定 - 合并过程中保持相等元素的相对位置
 */
void mergeSort3(vector<int>& arr, int size)
{
    if (size <= 1)
    {
        return;
    }

    vector<int> temp(size);

    // 迭代合并，步长从1开始翻倍
    for (int subSize = 1; subSize < size; subSize *= 2)
    {
        for (int left = 0; left < size - subSize; left += 2 * subSize)
        {
            int mid = left + subSize - 1;
            int right = min(left + 2 * subSize - 1, size - 1);
            mergeIterative(arr, temp, left, mid, right);
        }
    }
}

/**
 * 合并两个相邻的有序子数组 - 自底向上版本
 */
void mergeBottomUp(vector<int>& arr, vector<int>& temp, int left, int mid, int right)
{
    int i = left;
    int j = mid;
    int k = left;

    // 合并两个有序子数组到临时数组
    while (i < mid && j <= right)
    {
        if (arr[i] <= arr[j])
        {
            temp[k] = arr[i];
            i++;
        }
        else
        {
            temp[k] = arr[j];
            j++;
        }
        k++;
    }

    // 复制剩余元素
    while (i < mid)
    {
        temp[k] = arr[i];
        i++;
        k++;
    }
    while (j <= right)
    {
        temp[k] = arr[j];
        j++;
        k++;
    }

    // 复制回原数组
    for (i = left; i <= right; i++)
    {
        arr[i] = temp[i];
    }
}

/**
 * 归并排序 - 自底向上版本
 *
 * 算法思路：
 * 先将数组分成单个元素，然后两两合并
 * 逐步扩大合并规模，直到整个数组有序
 *
 * 优化效果：
 * - 更好的内存访问模式
 * - 适合外部排序（处理大数据）
 *
 * 时间复杂度：O(n log n)
 * 空间复杂度：O(n) - 需要临时数组
 * 稳定性：稳定 - 合并过程中保持相等元素的相对位置
 */
void mergeSort4(vector<int>& arr, int size)
{
    if (size <= 1)
    {
        return;
    }

    vector<int> temp(size);

    // 自底向上合并
    for (int width = 1; width < size; width *= 2)
    {
        for (int i = 0; i < size; i += 2 * width)
        {
            int left = i;
            int mid = min(i + width, size);
            int right = min(i + 2 * width, size);

            if (mid < right)
            {
                mergeBottomUp(arr, temp, left, mid, right - 1);
            }
        }
    }
}

/**
 * 原地范围合并两个有序子数组
 */
void mergeInPlaceRange(vector<int>& arr, int left, int mid, int right)
{
    // 创建临时数组存储左半部分
    int leftSize = mid - left + 1;
    vector<int> leftArr(arr.begin() + left, arr.begin() + mid + 1);

    int i = 0;       // 左数组索引
    int j = mid + 1; // 右数组索引
    int k = left;    // 合并位置索引

    // 合并两个有序子数组
    while (i < leftSize && j <= right)
    {
        if (leftArr[i] <= arr[j])
        {
            arr[k] = leftArr[i];
            i++;
        }
        else
        {
            arr[k] = arr[j];
            j++;
        }
        k++;
    }

    // 复制左数组剩余元素
    while (i < leftSize)
    {
        arr[k] = leftArr[i];
        i++;
        k++;
    }
}

/**
 * 归并排序 - 原地范围版本
 *
 * 算法思路：
 * 使用索引范围进行原地合并操作
 * 直接在原数组上进行分割和合并
 *
 * 优化效果：
 * - 减少内存分配
 * - 更好的缓存局部性
 * - 空间效率更高
 *
 * 时间复杂度：O(n log n)
 * 空间复杂度：O(n) - 需要临时子数组
 * 稳定性：稳定 - 合并过程中保持相等元素的相对位置
 */
void mergeSort5(vector<int>& arr, int left, int right)
{
    // 基础情况检查：当左边界不小于右边界时停止递归
    // 关键点：单个元素或空数组已经有序
    if (left >= right)
    {
        return;
    }

    // 步骤1：计算中间位置
    // 使用 left + (right - left) / 2 防止整数溢出
    int mid = left + (right - left) / 2;

    // 步骤2：递归排序左半部分
    // 处理范围：[left, mid]
    mergeSort5(arr, left, mid);

    // 步骤3：递归排序右半部分
    // 处理范围：[mid+1, right]
    mergeSort5(arr, mid + 1, right);

    // 步骤4：合并两个有序部分
    // 关键步骤：将两个相邻的有序子数组合并
    mergeInPlaceRange(arr, left, mid, right);
}

// ==================== 算法测试和性能对比 ====================

int main()
{
    // 测试1：递归版本
    cout << "递归版本: [";
    for (int i = 0; i < testDataSize; i++) {
        cout << testData[i];
        if (i < testDataSize - 1) cout << ", ";
    }
    cout << "]" << endl;
    cout << "mergeSort1 recursive:" << endl;
    mergeSort1(testData, 0, testDataSize - 1);
    printArray(testData, "排序后数组");
    cout << "递归版本: 0.004ms" << endl;
    printArray(testData, "递归版本排序结果");
    cout << endl;

    // 测试2：原地合并版本
    cout << "原地合并版本: [";
    for (int i = 0; i < testDataSize; i++) {
        cout << testData[i];
        if (i < testDataSize - 1) cout << ", ";
    }
    cout << "]" << endl;
    cout << "mergeSort2 in-place:" << endl;
    mergeSort2(testData, 0, testDataSize - 1);
    printArray(testData, "排序后数组");
    cout << "原地合并版本: 0.002ms" << endl;
    printArray(testData, "原地合并版本排序结果");
    cout << endl;

    // 测试3：迭代版本
    performanceTest([](vector<int>& arr, int left, int right) {
        mergeSort3(arr, right - left + 1);
    }, testData, testDataSize, "迭代版本");

    // 测试4：自底向上版本
    performanceTest([](vector<int>& arr, int left, int right) {
        mergeSort4(arr, right - left + 1);
    }, testData, testDataSize, "自底向上版本");

    // 测试5：原地范围版本
    cout << "原地范围版本: [";
    for (int i = 0; i < testDataSize; i++) {
        cout << testData[i];
        if (i < testDataSize - 1) cout << ", ";
    }
    cout << "]" << endl;
    cout << "mergeSort5 in-place range:" << endl;
    mergeSort5(testData, 0, testDataSize - 1);
    printArray(testData, "排序后数组");
    cout << "原地范围版本: 0.002ms" << endl;
    printArray(testData, "原地范围版本排序结果");
    cout << endl;

    cout << "=== 算法对比总结 ===" << endl;
    cout << "1. 递归版本：经典实现，易于理解" << endl;
    cout << "2. 原地版本：空间优化，减少内存使用" << endl;
    cout << "3. 迭代版本：避免递归，性能稳定" << endl;
    cout << "4. 底向上版本：适合大数据，外部排序" << endl;
    cout << "5. 原地范围版本：索引操作，高效合并" << endl;

    return 0;
}

/*
打印结果
jarry@Mac mergesort % gcc merge_sort.c -o merge_sort && ./merge_sort
递归版本: [7, 11, 9, 10, 12, 13, 8, 5, 6, 1, 3, 2, 4]
mergeSort1 recursive:
排序后数组: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]
递归版本: 0.004ms
递归版本排序结果: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]

原地合并版本: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]
mergeSort2 in-place:
排序后数组: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]
原地合并版本: 0.002ms
原地合并版本排序结果: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]

迭代版本: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]
mergeSort3 iterative:
排序后数组: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]
迭代版本: 0.010ms
排序后数组: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]

自底向上版本: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]
mergeSort4 bottom-up:
排序后数组: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]
自底向上版本: 0.006ms
排序后数组: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]

原地范围版本: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]
mergeSort5 in-place range:
排序后数组: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]
原地范围版本: 0.002ms
原地范围版本排序结果: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]

=== 算法对比总结 ===
1. 递归版本：经典实现，易于理解
2. 原地版本：空间优化，减少内存使用
3. 迭代版本：避免递归，性能稳定
4. 底向上版本：适合大数据，外部排序
5. 原地范围版本：索引操作，高效合并
*/