Chinaunix首页 | 论坛 | 博客
  • 博客访问: 4752451
  • 博文数量: 930
  • 博客积分: 12070
  • 博客等级: 上将
  • 技术积分: 11448
  • 用 户 组: 普通用户
  • 注册时间: 2008-08-15 16:57
文章分类

全部博文(930)

文章存档

2011年(60)

2010年(220)

2009年(371)

2008年(279)

分类: LINUX

2009-08-09 20:23:28

并查集:

(union-find sets)是一种简单的用途广泛的集合. 并查集是若干个不相交集合,能够实现较快的合并和判断元素所在集合的操作,应用很多。一般采取树形结构来存储并查集,并利用一个rank数组来存储集合的深度下界,在查找操作时进行路径压缩使后续的查找操作加速。这样优化实现的并查集,空间复杂度为O(N),建立一个集合的时间复杂度为O(1)N次合并M查找的时间复杂度为O(M Alpha(N)),这里AlphaAckerman函数的某个反函数,在很大的范围内(人类目前观测到的宇宙范围估算有1080次方个原子,这小于前面所说的范围)这个函数的值可以看成是不大于4的,所以并查集的操作可以看作是线性的。它支持以下三种操作:


  -Union (Root1, Root2) //并操作;把子集合Root2并入集合Root1.要求:Root1 Root2互不相交,否则不执行操作.
  -Find (x) //搜索操作;搜索元素x所在的集合,并返回该集合的名字
.
  -UFSets (s) //构造函数。将并查集中s个集合初始化为s个只有一个单元素的子集合
.
  -对于并查集来说,每个集合用一棵树表示。

  -集合中每个元素的元素名分别存放在树的结点中,此外,树的每一个结点还有一个指向其双亲结点的指针。
  -设 S1= {0, 6, 7, 8 }S2= { 1, 4, 9 }S3= { 2, 3, 5 }

    -为简化讨论,忽略实际的集合名,仅用表示集合的树的根来标识集合。
  -为此,采用树的双亲表示作为集合存储表示。集合元素的编号从0 n-1。其中 n 是最大元素个数。在双亲表示中,第 i 个数组元素代表包含集合元素 i 的树结点。根结点的双亲为-1,表示集合中的元素个数。为了区别双亲指针信息( ≥ 0 ),集合元素个数信息用负数表示。

 

S1 ∪ S2的可能的表示方法:


void ufsets(int s)

{//构造函数

    int   i, parent[s]; 

    for(i = 0;  i < s; i++){

       parent[i] = -1;

    }

}

int find(int x)//搜索操作

{

    if(parent[x] <= 0){

          return x;

    }

    else{

       return find(parent[x]);

}

void union(int root1, int root2){//合并操作

    parent[root2] = root1;//root2指向root1

}

FindUnion操作性能不好。假设最初 n 个元素构成 n 棵树组成的森林,parent[i] = -1。做处理Union(0, 1), Union(1, 2), …, Union(n-2, n-1)后,将产生如图所示的退化的树。

执行一次Union操作所需时间是O(1)n-1Union操作所需时间是O(n)。若再执行Find(0), Find(1), …, Find(n-1), 若被搜索的元素为i,完成Find(i)操作需要时间为O(i),完成 n 次搜索需要的总时间将达到

Union操作的加权规则

  为避免产生退化的树,改进方法是先判断两集合中元素的个数,如果以 i 为根的树中的结点个数少于以 j 为根的树中的结点个数,即parent[i] > parent[j],则让 j 成为 i 的双亲,否则,让i成为j的双亲。此即Union的加权规则

          parent[0](== -4) < parent[4] (== -3)

  void WeightedUnion(int Root1, int Root2) {
   //Union的加权规则改进的算法

   int temp = parent[Root1] + parent[Root2];
   
if ( parent[Root2] < parent[Root1] ) {
    parent[Root1] = Root2; //Root2中结点数多

    parent[Root2] = temp;  //Root1指向Root2
   }
   
else {
    parent[Root2] = Root1; //Root1中结点数多

    parent[Root1] = temp;  //Root2指向Root1
   }
  }

 

使用加权规则得到的树

下面是几到用并查集可以方便解决的问题:

题目: 亲戚(Relations)

或许你并不知道,你的某个朋友是你的亲戚。他可能是你的曾祖父的外公的女婿的外甥的表姐的孙子。如果能得到完整的家谱,判断两个人是否亲戚应该是可行的,但如果两个人的最近公共祖先与他们相隔好几代,使得家谱十分庞大,那么检验亲戚关系实非人力所能及.在这种情况下,最好的帮手就是计算机。

为了将问题简化,你将得到一些亲戚关系的信息,如同MarryTom是亲戚,TomB en是亲戚,等等。从这些信息中,你可以推出MarryBen是亲戚。请写一个程序,对于我们的关心的亲戚关系的提问,以最快的速度给出答案。

 

参考输入输出格式 输入由两部分组成。

第一部分以NM开始。N为问题涉及的人的个数(1 N 20000)。这些人的编号为1,2,3,,N。下面有M(1 M 1000000),每行有两个数ai, bi,表示已知aibi是亲戚.

第二部分以Q开始。以下Q行有Q个询问(1 Q 1 000 000),每行为ci, di,表示询问cidi是否为亲戚。

对于每个询问ci, di,若cidi为亲戚,则输出Yes,否则输出No

 
 
 

#include <stdio.h>
#include <stdlib.h>

#define TOTAL_NUM 10
#define RELATIONS 7

int PRE[TOTAL_NUM];
int RANK[TOTAL_NUM];

void init_set()
{
  int i;
  for(i=0;i<TOTAL_NUM;i++)
   {
     PRE[i] = -1;
     RANK[i] = 1;
   }
}

int find(int num)
{
  int r = num;
  while(PRE[r]!= -1)
    r = PRE[r];
    
   return r;
}

void unionone(int root1, int root2)
{
  if( RANK[root1]<RANK[root2] )
      PRE[root1] = root2;
  else
   {
     if(RANK[root1] == RANK[root2])
      {
       RANK[root1]++;
       }
      PRE[root2] = root1;
   }
}

int main(int argc, char *argv[])
{
  int i = 0;
  int num1;
  int num2;
  int root1;
  int root2;
  int counts = 3;
  
  init_set();
  for(i=0;i<RELATIONS;i++)
   {
     scanf("%d %d", &num1, &num2);
     getchar();
     printf("num1 is %d\tnum2 is %d\n", num1, num2);
     root1 = find(num1);
     root2 = find(num2);
     
     if(root1 != root2)
       unionone(root1,root2);
   }
   
  for(i = 0; i < counts; i++)
  {
    scanf("%d %d", &num1, &num2);
    getchar();
    if(find(num1) == find(num2))
      printf("%d %d YES\n",num1,num2);
    else
      printf("%d %d NO\n",num1,num2);
   }
 
  system("PAUSE");    
  return 0;
}

阅读(1144) | 评论(0) | 转发(1) |
给主人留下些什么吧!~~