堆排序彻底理解-renjian2011-ChinaUnix博客

蝈蝈的足迹

首页　| 　博文目录　| 　关于我

renjian2011

博客访问： 247767
博文数量： 62
博客积分： 973
博客等级：准尉
技术积分： 530
用户组：普通用户
注册时间： 2011-11-16 23:25

文章分类

全部博文（62）

Linux学习（7）
C/C++（14）
内核学习（4）
程序人生（3）
常见算法（29）
未分配的博文（5）

文章存档

2013年（1）

2012年（14）

2011年（47）

我的朋友

相关博文

堆排序彻底理解

分类： C/C++

2012-01-09 11:22:30

//baike.baidu.com/view/157305.htm
1991年计算机先驱奖获得者、斯坦福大学计算机科学系教授罗伯特·弗洛伊德(Robert W．Floyd)和威廉姆斯(J．Williams)在1964年共同发明了著名的堆排序算法( Heap Sort )

堆的定义：
    n个关键字序列Kl，K2，…，Kn称为堆，当且仅当该序列满足如下性质(简称为堆性质)：
    (1) ki≤K2i 且 ki≤K2i+1    (1≤i≤n) ---- 小根堆
或者
    大根堆：(2) Ki≥K2i 且 ki≥K2i+1    (1≤i≤n)

若将此序列所存储的向量R[1..n]看做是一棵完全二叉树的存储结构，则堆实质上是满足如下性质的完全二叉树：
树中任一非叶结点的关键字均不大于(或不小于)其左右孩子(若存在)结点的关键字。

堆排序算法特性：

    堆排序的时间，主要由建立初始]堆和反复重建堆这两部分的时间开销构成，它们均是通过调用Heapify实现的。由于建初始堆所需的比较次数较多，所以堆排序不适宜于记录数较少的文件。
    堆排序的最坏时间复杂度为O(nlogn)。堆序的平均性能较接近于最坏性能。
    堆排序是就地排序，辅助空间为O(1)，
    它是不稳定的排序方法。

堆排序过程

有以下三个操作：

1) 最大堆调整（Max_Heapify）：将堆的末端子结点作调整，使得子结点永远小于父结点
2) 创建最大堆（Build_Max_Heap）：将堆所有数据重新排序
3) 排序（HeapSort）：移除位在第一个数据的根结点，并做最大堆调整的递归运算

(1) 最大堆调整：

//blog.csdn.net/v_JULY_v/article/details/6198644 ===================

为了保持最大堆的性质，我们运用MAX-HEAPIFY操作，作调整，递归调用此操作，使i为根的子树成为最大堆。

MAX-HEAPIFY算法，如下所示（核心）：

    MAX-HEAPIFY(A, i)
     1 l ← LEFT(i)
     2 r ← RIGHT(i)
     3 if l ≤ heap-size[A] and A[l] > A[i]
     4   then largest ← l
     5    else largest ← i
     6 if r ≤ heap-size[A] and A[r] > A[largest]
     7   then largest ← r
     8 if largest ≠ i
     9   then exchange A[i] <-> A[largest]
    10         MAX-HEAPIFY(A, largest)

如上，首先第一步，在对应的数组元素A[i], 左孩子A[LEFT(i)], 和右孩子A[RIGHT(i)]中找到最大的那一个，将其下标存储在largest中。如果A[i]已经就是最大的元素，则程序直接结束。否则，i的某个子结点为最大的元素，将其，即A[largest]与A[i]交换，从而使i及其子女都能满足最大堆性质。下标largest所指的元素变成了A[i]的值，会违反最大堆性质，所以对largest所指元素调用MAX-HEAPIFY。如下，是此MAX-HEAPIFY的演示过程（下图是把4调整到最底层，一趟操作，但摸索的时间为LogN）：

由上图，我们很容易看出，初始构造出一最大堆之后，在元素A[i]，即16，大于它的俩个子结点4、10，满足最大堆性质。所以，i下调指向着4,小于,左子14，所以，调用MAX-HEAPIFY，4与其子，14交换位置。但4处在了14原来的位置之后，4小于其右子8，又违反了最大堆的性质，所以再递归调用MAX-HEAPIFY，将4与8，交换位置。于是，满足了最大堆性质，程序结束。

时间复杂度：

MAX-HEAPIFY作用在一棵以结点i为根的、大小为n的子树上时，其运行时间为调整元素A[i]、A[LEFT(i)]，A[RIGHT(i)]的关系时所用时间为O(1)，再加上，对以i的某个子结点为根的子树调用MAX-HEAPIFY所需的时间，且i结点的子树大小至多为n/2 (原文为2n/3)，所以，MAX-HEAPIFY的运行时间为
T (n) ≤ T(n/2) + Θ(1).

我们，可以证得此式子的递归解为T(n)=O(lgn)。具体证法，可参考算法导论第6章之6.2节，这里，略过。

(2) 建堆

    BUILD-MAX-HEAP(A)
    1 heap-size[A] ← length[A]
    2 for i ← |_length[A]/2_| downto 1
    3       do MAX-HEAPIFY(A, i)

//建堆，怎么建列?原来就是不断的调用MAX-HEAPIFY(A, i)来建立最大堆。

(3) 排序及实现

//baike.baidu.com/view/157305.htm ================================

/*
用大根堆排序的基本思想
① 先将初始文件R[1..n]建成一个大根堆，此堆为初始的无序区
② 再将关键字最大的记录R[1](即堆顶)和无序区的最后一个记录R[n]交换，
由此得到新的无序区R[1..n-1]和有序区R[n]，且满足R[1..n-1].keys≤R[n].key
③ 由于交换后新的根R[1]可能违反堆性质，故应将当前无序区R[1..n-1]调整为堆。
然后再次将R[1..n-1]中关键字最大的记录R[1]和该区间的最后一个记录R[n-1]交换，
由此得到新的无序区R[1..n-2]和有序区R[n-1..n]，

且仍满足关系R[1..n- 2].keys≤R[n-1..n].keys，
同样要将R[1..n-2]调整为堆。
……
直到无序区只有一个元素为止。
*/

void HeapAdjust(int array[], int i, int nLen)
{
int nChild;
int nTemp;

    nTemp = array[i]； // 父结点。    swap-1
    for(; (2*i+1) < nLen; i = nChild)
    {
        //子结点的位置 = 2 * (父结点的位置) + 1
        nChild = 2*i + 1;

        //取子结点中较大的
        if(nChild < nLen - 1 && array[nChild+1] > array[nChild])
            ++nChild;
        // 如果较大的子结点>父结点，那么把较大的往上移动，替换父结点
        if(nTemp < array[nChild])
        {
            array[i] = array[nChild]; // swap-2
        }
        else //否则父结点已经是最大的
            break;

        // 最后把被替换的父结点值放回子结点处
        array[nChild] = nTemp; // swap-3
    }
}

void HeapSort(int array[], int length)
{
    int i, nTemp;
    //调整序列的前半部分，调整完之后第一个元素是序列的最大的元素
    //从而将array[0, lenght-1]建成大根堆
    for(i = length/2 - 1; i >= 0; --i)
    {
        HeapAdjust(array, i, length);
    }
    //从最后一个元素开始对序列进行调整

    for( i = length-1; i > 0; --i)
    {
        //把第一个元素和当前的最后一个元素交换
        //保证当前的最后一个位置的元素都是在现在的这个序列之中最大的
        nTemp = array[0];
        array[0] = array[i]; array[i] = nTemp;
        //缩小范围，将array[0..i--]重新调整为大根堆
        HeapAdjust(array, i, length);
    }
}

//end

阅读(6508) | 评论(0) | 转发(0) |

上一篇：Cache对性能的影响

下一篇：STL容器类总结

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6