Chinaunix首页 | 论坛 | 博客
  • 博客访问: 125069
  • 博文数量: 18
  • 博客积分: 2000
  • 博客等级: 大尉
  • 技术积分: 580
  • 用 户 组: 普通用户
  • 注册时间: 2007-08-23 11:58
文章分类

全部博文(18)

文章存档

2011年(1)

2009年(5)

2008年(12)

我的朋友
最近访客

分类:

2008-10-24 01:57:33

选择排序、快速排序、希尔排序、堆排序不是稳定的排序算法,

而冒泡排序、插入排序、归并排序和基数排序是稳定的排序算法。

 
这几天笔试了好几次了,连续碰到一个关于常见排序算法稳定性判别的问题,往往还是多选,对于我以及和我一样拿不准的同学可不是一个能轻易下结论的题目,当然如果你笔试之前已经记住了数据结构书上哪些是稳定的,哪些不是稳定的,做起来应该可以轻松搞定。本文是针对老是记不住这个或者想真正明白到底为什么是稳定或者不稳定的人准备的。

      首先,排序算法的稳定性大家应该都知道,通俗地讲就是能保证排序前2个相等的数其在序列的前后位置顺序和排序后它们两个的前后位置顺序相同。在简单形式化一下,如果Ai = Aj, Ai原来在位置前,排序后Ai还是要在Aj位置前。

     其次,说一下稳定性的好处。排序算法如果是稳定的,那么从一个键上排序,然后再从另一个键上排序,第一个键排序的结果可以为第二个键排序所用。基数排序就是这样,先按低位排序,逐次按高位排序,低位相同的元素其顺序再高位也相同时是不会改变的。另外,如果排序算法稳定,对基于比较的排序算法而言,元素交换的次数可能会少一些(个人感觉,没有证实)。

     回到主题,现在分析一下常见的排序算法的稳定性,每个都给出简单的理由。

   (1)冒泡排序

        冒泡排序就是把小的元素往前调或者把大的元素往后调。比较是相邻的两个元素比较,交换也发生在这两个元素之间。所以,如果两个元素相等,我想你是不会再无聊地把他们俩交换一下的;如果两个相等的元素没有相邻,那么即使通过前面的两两交换把两个相邻起来,这时候也不会交换,所以相同元素的前后顺序并没有改变,所以冒泡排序是一种稳定排序算法。

(2)选择排序

      选择排序是给每个位置选择当前元素最小的,比如给第一个位置选择最小的,在剩余元素里面给第二个元素选择第二小的,依次类推,直到第n-1个元素,第n个元素不用选择了,因为只剩下它一个最大的元素了。那么,在一趟选择,如果当前元素比一个元素小,而该小的元素又出现在一个和当前元素相等的元素后面,那么交换后稳定性就被破坏了。比较拗口,举个例子,序列5 8 5 2 9, 我们知道第一遍选择第1个元素5会和2交换,那么原序列中2个5的相对前后顺序就被破坏了,所以选择排序不是一个稳定的排序算法。

(3)插入排序
     插入排序是在一个已经有序的小序列的基础上,一次插入一个元素。当然,刚开始这个有序的小序列只有1个元素,就是第一个元素。比较是从有序序列的末尾开始,也就是想要插入的元素和已经有序的最大者开始比起,如果比它大则直接插入在其后面,否则一直往前找直到找到它该插入的位置。如果碰见一个和插入元素相等的,那么插入元素把想插入的元素放在相等元素的后面。所以,相等元素的前后顺序没有改变,从原无序序列出去的顺序就是排好序后的顺序,所以插入排序是稳定的。

(4)快速排序
    快速排序有两个方向,左边的i下标一直往右走,当a[i] <= a[center_index],其中center_index是中枢元素的数组下标,一般取为数组第0个元素。而右边的j下标一直往左走,当a[j] > a[center_index]。如果i和j都走不动了,i <= j, 交换a[i]和a[j],重复上面的过程,直到i>j。 交换a[j]和a[center_index],完成一趟快速排序。在中枢元素和a[j]交换的时候,很有可能把前面的元素的稳定性打乱,比如序列为 5 3 3 4 3 8 9 10 11, 现在中枢元素5和3(第5个元素,下标从1开始计)交换就会把元素3的稳定性打乱,所以快速排序是一个不稳定的排序算法,不稳定发生在中枢元素和a[j]交换的时刻。

(5)归并排序
    归并排序是把序列递归地分成短序列,递归出口是短序列只有1个元素(认为直接有序)或者2个序列(1次比较和交换),然后把各个有序的段序列合并成一个有序的长序列,不断合并直到原序列全部排好序。可以发现,在1个或2个元素时,1个元素不会交换,2个元素如果大小相等也没有人故意交换,这不会破坏稳定性。那么,在短的有序序列合并的过程中,稳定是是否受到破坏?没有,合并过程中我们可以保证如果两个当前元素相等时,我们把处在前面的序列的元素保存在结果序列的前面,这样就保证了稳定性。所以,归并排序也是稳定的排序算法。

(6)基数排序
   基数排序是按照低位先排序,然后收集;再按照高位排序,然后再收集;依次类推,直到最高位。有时候有些属性是有优先级顺序的,先按低优先级排序,再按高优先级排序,最后的次序就是高优先级高的在前,高优先级相同的低优先级高的在前。基数排序基于分别排序,分别收集,所以其是稳定的排序算法。

(7)希尔排序(shell)
    希尔排序是按照不同步长对元素进行插入排序,当刚开始元素很无序的时候,步长最大,所以插入排序的元素个数很少,速度很快;当元素基本有序了,步长很小,插入排序对于有序的序列效率很高。所以,希尔排序的时间复杂度会比o(n^2)好一些。由于多次插入排序,我们知道一次插入排序是稳定的,不会改变相同元素的相对顺序,但在不同的插入排序过程中,相同的元素可能在各自的插入排序中移动,最后其稳定性就会被打乱,所以shell排序是不稳定的。

(8)堆排序
   我们知道堆的结构是节点i的孩子为2*i和2*i+1节点,大顶堆要求父节点大于等于其2个子节点,小顶堆要求父节点小于等于其2个子节点。在一个长为n的序列,堆排序的过程是从第n/2开始和其子节点共3个值选择最大(大顶堆)或者最小(小顶堆),这3个元素之间的选择当然不会破坏稳定性。但当为n/2-1, n/2-2, ...1这些个父节点选择元素时,就会破坏稳定性。有可能第n/2个父节点交换把后面一个元素交换过去了,而第n/2-1个父节点把后面一个相同的元素没有交换,那么这2个相同的元素之间的稳定性就被破坏了。所以,堆排序不是稳定的排序算法。

 

排序算法的各趟排序算法
 
以关键字序列(265,301,751,129,937,863,742,694,076,438)为例,分别写出执行以下排序算法的各趟排序结束时,关键字序列的状态。
  (1) 直接插入排序 (2)希尔排序 (3)冒泡排序 (4)快速排序
  (5) 直接选择排序 (6) 堆排序 (7) 归并排序 (8)基数排序
  上述方法中,哪些是稳定的排序?哪些是非稳定的排序?对不稳定的排序试举出一个不稳定的实例。
  答: (1)直接插入排序:(方括号表示无序区)
  初始态: 265[301 751 129 937 863 742 694 076 438]
  第一趟:265 301[751 129 937 863 742 694 076 438]
  第二趟:265 301 751[129 937 863 742 694 076 438]
  第三趟:129 265 301 751[937 863 742 694 076 438]
  第四趟:129 265 301 751 937[863 742 694 076 438]
  第五趟:129 265 301 751 863 937[742 694 076 438]
  第六趟:129 265 301 742 751 863 937[694 076 438]
  第七趟:129 265 301 694 742 751 863 937[076 438]
  第八趟:076 129 265 301 694 742 751 863 937[438]
  第九趟:076 129 265 301 438 694 742 751 863 937
  (2)希尔排序(增量为5,3,1)
  初始态: 265 301 751 129 937 863 742 694 076 438
  第一趟:265 301 694 076 438 863 742 751 129 937
  第二趟:076 301 129 265 438 694 742 751 863 937
  第三趟:076 129 265 301 438 694 742 751 863 937
  (3)冒泡排序(方括号为无序区)
  初始态 [265 301 751 129 937 863 742 694 076 438]
  第一趟: 076 [265 301 751 129 937 863 742 694 438]
  第二趟: 076 129 [265 301 751 438 937 863 742 694]
  第三趟: 076 129 265 [301 438 694 751 937 863 742]
  第四趟: 076 129 265 301 [438 694 742 751 937 863]
  第五趟: 076 129 265 301 438 [694 742 751 863 937]
  第六趟: 076 129 265 301 438 694 742 751 863 937
  (4)快速排序:(方括号表示无序区,层表示对应的递归树的层数)
  初始态: [265 301 751 129 937 863 742 694 076 438]
  第二层: [076 129] 265 [751 937 863 742 694 301 438]
  第三层: 076 [129] 265 [438 301 694 742] 751 [863 937]
  第四层: 076 129 265 [301] 438 [694 742] 751 863 [937]
  第五层: 076 129 265 301 438 694 [742] 751 863 937
  第六层: 076 129 265 301 438 694 742 751 863 937
(5)直接选择排序:(方括号为无序区)
  初始态  [265 301 751 129 937 863 742 694 076 438]
  第一趟: 076 [301 751 129 937 863 742 694 265 438]
  第二趟: 076 129 [751 301 937 863 742 694 265 438]
  第三趟: 076 129 265[ 301 937 863 742 694 751 438]
  第四趟: 076 129 265 301 [937 863 742 694 751 438]
  第五趟: 076 129 265 301 438 [863 742 694 751 937]
  第六趟: 076 129 265 301 438 694 [742 751 863 937]
  第七趟: 076 129 265 301 438 694 742 [751 863 937]
  第八趟: 076 129 265 301 438 694 742 751 [937 863]
  第九趟: 076 129 265 301 438 694 742 751 863 937
  (6)堆排序:(通过画二*树可以一步步得出排序结果)
  初始态    [265 301 751 129 937 863 742 694 076 438]
  建立初始堆: [937 694 863 265 438 751 742 129 075 301]
  第一次排序重建堆:[863 694 751 765 438 301 742 129 075] 937
  第二次排序重建堆:[751 694 742 265 438 301 075 129] 863 937
  第三次排序重建堆:[742 694 301 265 438 129 075] 751 863 937
  第四次排序重建堆:[694 438 301 265 075 129] 742 751 863 937
  第五次排序重建堆:[438 265 301 129 075] 694 742 751 863 937
  第六次排序重建堆:[301 265 075 129] 438 694 742 751 863 937
  第七次排序重建堆:[265 129 075] 301 438 694 742 751 863 937
  第八次排序重建堆:[129 075]265 301 438 694 742 751 863 937
  第九次排序重建堆:075 129 265 301 438 694 742 751 863 937
  (7)归并排序(为了表示方便,采用自底向上的归并,方括号为有序区)
  初始态:[265] [301] [751] [129] [937] [863] [742] [694] [076] [438]
  第一趟:[265 301] [129 751] [863 937] [694 742] [076 438]
  第二趟:[129 265 301 751] [694 742 863 937] [076 438]
  第三趟:[129 265 301 694 742 751 863 937] [076 438]
  第四趟:[076 129 265 301 438 694 742 751 863 937]
  (8)基数排序(方括号内表示一个箱子共有10个箱子,箱号从0到9)
  初始态:265 301 751 129 937 863 742 694 076 438
  第一趟:[] [301 751] [742] [863] [694] [265] [076] [937] [438] [129]
  第二趟:[301] [] [129] [937 438] [742] [751] [863 265] [076] [] [694]
  第三趟:[075] [129] [265] [301] [438] [] [694] [742 751] [863] [937]
  在上面的排序方法中,直接插入排序、冒泡排序、归并排序和基数排序是稳定的,其他排序算法均是不稳定的,现举实例如下:以带*号的表示区别。
  希尔排序:[8,1,10,5,6,*8]
  快速排序:[2,*2,1]
  直接选择排序:[2,*2,1]
  堆排序:[2,*2,1]
 
 
阅读(811) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~