归并排序mergesort的C实现-shark888-ChinaUnix博客

大白鲨

首页　| 　博文目录　| 　关于我

shark888

博客访问： 1715347
博文数量： 585
博客积分： 14610
博客等级：上将
技术积分： 7402
用户组：普通用户
注册时间： 2008-05-15 10:52

文章分类

全部博文（585）

报表编程（2）
软件架构与设计（16）
网络应用/路由/安（27）
嵌入开发/CCD/Lin（21）
系统应用（12）

虚拟机应用（10）

window（2）
OpenSource（9）
VC编程技巧（37）
多线程编程（9）
图像处理与识别(（24）
网络编程（41）
C/C++ /VC（19）
OpenGL/OpenGv（2）
Web开发（3）
VC编程（95）

自定义组件（5）

基本组件（0）
算法&加密与解密（39）
Java（4）

JSP/Server（0）

数据库应用（2）
数据库管理/开发（13）
游戏开发&多媒体（4）
项目管理（5）
软件工程（50）
软件测试（2）
招聘（3）
未分配的博文（148）

文章存档

2013年（5）

2012年（214）

2011年（56）

2010年（66）

2009年（44）

2008年（200）

我的朋友

相关博文

归并排序mergesort的C实现

分类： C/C++

2011-08-23 10:10:49

所有的排序算法中，我比较喜欢归并排序的思想，它采用了一种分解--整合---上报的思想。它把一个任务平均分成了2份，交给两个下属去做，然后将下属上报上来的结果，整合完整，整合完整后，在上报给自己的上级。这种思想很优美。

而且归并排序有一个好的特性，无论何等输入，对N个元素排序所需的时间与NlogN成正比。这种特性的达成是因为它把任务平均分成了互不干扰的2份，交给两个下属分别去做，然后将两个下属的成果整合（merge）。这种平均分2份，造就了归并的优越性。

注图片来源：爪哇人的技术博客（如有侵权，通知我删除图片）

我们考虑下前面提到的快速排序，快速排序也是递归实现，也是把一个任务分成了两份，但是有个问题，可能两份不一样多。我们回想下，前文快速排序quicksort的C实现中提到，每次把最右边的元素作为主元或者是衡量的坐标，把比主元大的放到主元的右边，比主元小的放在主元的左边，有一种极端的情况是，主元是最大的元素，或者主元是最小的元素，那么，我们的分治并没有起到效果，，因为左右两边很不均衡。所以说极端情况下，快速排序并不快速，和输入有一定关系。当然也有解决的办法，比如随机选择一个元素作为主元。即随机快速排序算法。

OK，再次回到的我们的归并排序。所谓归并排序，关键在归并，即前面提到的整合。两个下属已经上报了2个排好顺序的数组上报上来了，接下来就是要归并。归并的含义是，把两个已序的数组合并成一个已序的大数组。

首先array[l]~array[mid] 是一个下属提上来的已序的数组， array[mid+1]~array[r],是另外一个下属提上来的已序的数组。我们需要一个辅助的数组来实现归并。

void merge(int array[],int l,int mid,int r,int aux[])
{
int i,j,k;
for(i = l;i<=mid;i++)
aux[i] = array[i];
for(j = mid+1;j<=r;j++)
aux[j] = array[mid+1+r-j];
i = l;j =r;
for(k = l;k<=r;k++)
{
if(aux[j] <aux[i])
{
array[k] = aux[j--];
}
else
{
array[k] = aux[i++];
}
}
}

OK，需要提一句归并排序的缺点了，归并排序的缺点就是他需要一个辅助数组。换句话说，他需要额外的空间。当然可以采用其他办法来克服这个缺点，但是代价有点大。

好，闲言少叙，上代码：

2. #include
3. #include
4. #include
6. void merge(int array[],int l,int mid,int r,int aux[])
7. {
8. int i,j,k;
9. for(i = l;i<=mid;i++)
10. aux[i] = array[i];
12. for(j = mid+1;j<=r;j++)
13. aux[j] = array[mid+1+r-j];
15. i = l;j =r;
16. for(k = l;k<=r;k++)
17. {
18. if(aux[j]
19. {
20. array[k] = aux[j--];
21. }
22. else
23. {
24. array[k] = aux[i++];
25. }
26. }
28. }
30. void mergesort_r(int array[],int l,int r,int aux[])
31. {
32. int mid = (l+r)/2;
33. if(r<=l)
34. return ;
35. mergesort_r(array,l,mid,aux);
36. mergesort_r(array,mid+1,r,aux);
37. merge(array,l,mid,r,aux);/*把两个下属完成的两个已序的小数组归并成一个大的已序数组*/
38. }
40. int mergesort(int array[],int l,int r)
41. {
42. if(r
43. {
44. return -1;
45. }
46. if(r == l)
47. {
48. return 0;
49. }
51. int len = r - l + 1;
52. int *aux = malloc(sizeof(int)*len); /*需要额外的空间，这是mergesort的缺点*/
53. if(aux == NULL)
54. {
55. return -2;
56. }
57. mergesort_r(array,l,r,aux);
58. free(aux);
59. return 0;
60. }
62. int test_mergesort()
63. {
64. int i;
65. int number = 12;
67. int *array = malloc(number*sizeof(int));
69. if(array == NULL )
70. {
71. printf("malloc failed\n");
72. return -1;
73. }
76. printf("----------------------------------------before merge sort--------------\n");
77. srand(time(NULL));
78. for(i = 0;i
79. {
80. array[i] = rand()%1000;
81. printf("\tarray[%6d] = %6d\n",i,array[i]);
82. }
84. if（mergesort(array,0,number-1)）
85. {
86. printf("mergesort failed \n");
87. return -2;
88. }
90. printf("----------------------------------------after merge sort-----------------\n");
91. for(i = 0;i
92. {
93. printf("\tarray[%6d] = %6d\n",i,array[i]);
94. }
free(array);

return 0;

}
int main()
{
test_mergesort();
return 0;
}
----------------------------------------before merge sort--------------
array[ 0] = 592
array[ 1] = 485
array[ 2] = 750
array[ 3] = 325
array[ 4] = 477
array[ 5] = 838
array[ 6] = 184
array[ 7] = 723
array[ 8] = 229
array[ 9] = 314
array[ 10] = 52
array[ 11] = 42
----------------------------------------after merge sort-----------------
array[ 0] = 42
array[ 1] = 52
array[ 2] = 184
array[ 3] = 229
array[ 4] = 314
array[ 5] = 325
array[ 6] = 477
array[ 7] = 485
array[ 8] = 592
array[ 9] = 723
array[ 10] = 750
array[ 11] = 838

下面提一下归并排序的另外一个缺点，函数调用太多了，看下mergesort_r中的这条语句

if(r<=l)
return ;

mergesort太懒了，啥活也不干，来了活就分解给自己的下属。对于长度少于10的数组排序，完全可以直接排序了，不要在找下属。我们可以想见，按照上面的代码，如果有100万个元素需要排序，那么最底层的就有100万个函数，return上报给自己的直接上级，这种情况对于我这种对递归嵌套深度有恐惧的人来说太可怕了。

一种优化的方法是

if（r-l <= 10）

{

insertsort(a,l,r);

return;
}

insertsort的效率是不高，但是应付长度低于10的数组，足够了。而且减少了大量的函数调用，效率有提升。

数组个数为2^N的理想情况下，减少一层调用，函数掉用就降为原来的1/3，

对于10以下的数组直接排序，相当于减少了长度为8 4 2 这三层函数的调用，至少降为原来的1/27。函数调用从100万降到了4万左右。

阅读(627) | 评论(0) | 转发(0) |

0

上一篇：MFC的文档/ 视图的概念

下一篇：希尔排序shellsort的C实现

给主人留下些什么吧！~~

评论热议

请登录后评论。
登录注册