Chinaunix首页 | 论坛 | 博客
  • 博客访问: 243895
  • 博文数量: 62
  • 博客积分: 973
  • 博客等级: 准尉
  • 技术积分: 530
  • 用 户 组: 普通用户
  • 注册时间: 2011-11-16 23:25
文章分类

全部博文(62)

文章存档

2013年(1)

2012年(14)

2011年(47)

分类: C/C++

2012-01-09 11:22:30

//baike.baidu.com/view/157305.htm
    1991年计算机先驱奖获得者、斯坦福大学计算机科学系教授罗伯特·弗洛伊德(Robert W.Floyd)和威廉姆斯(J.Williams)在1964年共同发明了著名的堆排序算法( Heap Sort )
堆的定义
    n个关键字序列Kl,K2,…,Kn称为堆,当且仅当该序列满足如下性质(简称为堆性质):
    (1) ki≤K2i 且 ki≤K2i+1    (1≤i≤n) ---- 小根堆  
或者
    大根堆:(2) Ki≥K2i 且 ki≥K2i+1    (1≤i≤n)
    若将此序列所存储的向量R[1..n]看做是一棵完全二叉树的存储结构,则堆实质上是满足如下性质的完全二叉树:
    树中任一非叶结点的关键字均不大于(或不小于)其左右孩子(若存在)结点的关键字。
 
堆排序算法特性:
    堆排序的时间,主要由建立初始]堆和反复重建堆这两部分的时间开销构成,它们均是通过调用Heapify实现的。由于建初始堆所需的比较次数较多,所以堆排序不适宜于记录数较少的文件。
    堆排序的最坏时间复杂度为O(nlogn)。堆序的平均性能较接近于最坏性能。
    堆排序是就地排序,辅助空间为O(1),
    它是不稳定的排序方法。
 
堆排序过程
有以下三个操作:
  1) 最大堆调整(Max_Heapify):将堆的末端子结点作调整,使得子结点永远小于父结点
  2) 创建最大堆(Build_Max_Heap):将堆所有数据重新排序
  3) 排序(HeapSort):移除位在第一个数据的根结点,并做最大堆调整的递归运算
 
(1) 最大堆调整:
//blog.csdn.net/v_JULY_v/article/details/6198644 ===================
    为了保持最大堆的性质,我们运用MAX-HEAPIFY操作,作调整,递归调用此操作,使i为根的子树成为最大堆。
MAX-HEAPIFY算法,如下所示(核心):
    MAX-HEAPIFY(A, i)
     1  l ← LEFT(i)
     2  r ← RIGHT(i)
     3  if l ≤ heap-size[A] and A[l] > A[i]
     4     then largest ← l
     5     else largest ← i
     6  if r ≤ heap-size[A] and A[r] > A[largest]
     7     then largest ← r
     8  if largest ≠ i
     9     then exchange A[i] <-> A[largest]
    10         MAX-HEAPIFY(A, largest)
    如上,首先第一步,在对应的数组元素A[i], 左孩子A[LEFT(i)], 和右孩子A[RIGHT(i)]中找到最大的那一个,将其下标存储在largest中。如果A[i]已经就是最大的元素,则程序直接结束。否则,i的某个子结点为最大的元素,将其,即A[largest]与A[i]交换,从而使i及其子女都能满足最大堆性质。下标largest所指的元素变成了A[i]的值,会违反最大堆性质,所以对largest所指元素调用MAX-HEAPIFY。如下,是此MAX-HEAPIFY的演示过程(下图是把4调整到最底层,一趟操作,但摸索的时间为LogN):
   
 
    由上图,我们很容易看出,初始构造出一最大堆之后,在元素A[i],即16,大于它的俩个子结点4、10,满足最大堆性质。所以,i下调指向着4,小于,左子14,所以,调用MAX-HEAPIFY,4与其子,14交换位置。但4处在了14原来的位置之后,4小于其右子8,又违反了最大堆的性质,所以再递归调用MAX-HEAPIFY,将4与8,交换位置。于是,满足了最大堆性质,程序结束。
 
时间复杂度:
    MAX-HEAPIFY作用在一棵以结点i为根的、大小为n的子树上时,其运行时间为调整元素A[i]、A[LEFT(i)],A[RIGHT(i)]的关系时所用时间为O(1),再加上,对以i的某个子结点为根的子树调用MAX-HEAPIFY所需的时间,且i结点的子树大小至多为n/2 (原文为2n/3),所以,MAX-HEAPIFY的运行时间为
     T (n) ≤ T(n/2) + Θ(1).
我们,可以证得此式子的递归解为T(n)=O(lgn)。具体证法,可参考算法导论第6章之6.2节,这里,略过。
 
(2) 建堆
    BUILD-MAX-HEAP(A)
    1  heap-size[A] ← length[A]
    2  for i ← |_length[A]/2_| downto 1
    3       do MAX-HEAPIFY(A, i)   
//建堆,怎么建列?原来就是不断的调用MAX-HEAPIFY(A, i)来建立最大堆。
 
(3) 排序及实现
//baike.baidu.com/view/157305.htm ================================
/*
   用大根堆排序的基本思想
   ① 先将初始文件R[1..n]建成一个大根堆,此堆为初始的无序区
   ② 再将关键字最大的记录R[1](即堆顶)和无序区的最后一个记录R[n]交换,
   由此得到新的无序区R[1..n-1]和有序区R[n],且满足R[1..n-1].keys≤R[n].key
   ③ 由于交换后新的根R[1]可能违反堆性质,故应将当前无序区R[1..n-1]调整为堆。
   然后再次将R[1..n-1]中关键字最大的记录R[1]和该区间的最后一个记录R[n-1]交换,
   由此得到新的无序区R[1..n-2]和有序区R[n-1..n],
      且仍满足关系R[1..n- 2].keys≤R[n-1..n].keys,
   同样要将R[1..n-2]调整为堆。
   ……
   直到无序区只有一个元素为止。
*/
void HeapAdjust(int array[], int i, int nLen)
{
    int nChild;
    int nTemp;
    nTemp = array[i]; // 父结点。    swap-1
    for(; (2*i+1) < nLen; i = nChild)
    {       
        //子结点的位置 = 2 * (父结点的位置) + 1
        nChild = 2*i + 1;
        //取子结点中较大的
        if(nChild < nLen - 1 && array[nChild+1] > array[nChild])
            ++nChild;
        // 如果较大的子结点>父结点,那么把较大的往上移动,替换父结点
        if(nTemp < array[nChild])
        {
            array[i] = array[nChild];  // swap-2
        }
        else //否则父结点已经是最大的
            break;
        // 最后把被替换的父结点值放回子结点处
        array[nChild] = nTemp;  // swap-3
    }
}
void HeapSort(int array[], int length)
{
    int i, nTemp;
    //调整序列的前半部分,调整完之后第一个元素是序列的最大的元素
    //从而将array[0, lenght-1]建成大根堆
    for(i = length/2 - 1; i >= 0; --i)
    {
        HeapAdjust(array, i, length);
    }
    //从最后一个元素开始对序列进行调整
    for( i = length-1; i > 0; --i)
    {
        //把第一个元素和当前的最后一个元素交换
        //保证当前的最后一个位置的元素都是在现在的这个序列之中最大的
        nTemp = array[0];
        array[0] = array[i];  array[i] = nTemp;
        //缩小范围,将array[0..i--]重新调整为大根堆
        HeapAdjust(array, i, length);
    }
}
 
//end
阅读(6449) | 评论(0) | 转发(0) |
0

上一篇:Cache对性能的影响

下一篇:STL容器类总结

给主人留下些什么吧!~~