问题描述:
设T[0:n-1]是n个元素的数组。对任一元素x,设S(x)={i|T[i]=x}。当|S(x)|>n/2时,称x为T的主元素。设计一个线性时间算法,确定T[0:n-1]是否有一个主元素。
分析与解答:
(1)基于分治法的线性期望时间求主元素算法
中位数:数列排序后位于最中间的那个数,如果一个数列有主元素,那么必然是中位数。求一个数列有没有主元素,只要看中位数是不是主元素。
找中位数的方法:选择一个元素作为划分起点,然后用快速排序的方法将小于它的移动到左边,大于它的移动到右边。这样将元素划分为两个部分。此时,划分元素所在位置为k。如果k>n/2,那么继续用同样的方法在左边部分找;反之,就在右边部分找;k=n/2时,就找到了中位数。
根据快速排序的思想,可以在平均时间复杂度为O(n)的时间找出一个数列的中位数。然后再用O(n)的时间检查它是否为主元素。
代码如下所示。
-
#include <iostream>
-
using namespace std;
-
-
#define MAXNUM 100
-
-
//基于分治法的线性期望时间求主元素算法
-
void Swap(int *a, int *b)
-
{
-
int tmp = *a;
-
*a = *b;
-
*b = tmp;
-
}
-
-
//随机划分
-
int PartitionRandom(int a[], int first, int last)
-
{
-
int priot = first + rand() % (last - first + 1);
-
Swap(&a[first], &a[priot]);
-
int key = a[first];
-
-
while(first < last)
-
{
-
while(first < last && a[last] >= key)
-
{
-
last--;
-
}
-
Swap(&a[first], &a[last]);
-
-
while(first < last && a[first] <= key)
-
{
-
first++;
-
}
-
Swap(&a[first], &a[last]);
-
}
-
return first;
-
}
-
-
int Select(int a[], int first, int last , int i)
-
{
-
if(first == last)
-
{
-
return a[first];
-
}
-
int priot = PartitionRandom(a, first, last);
-
int k = priot - first + 1;
-
if(k == i)
-
{
-
return a[k];
-
}
-
if(k > i)
-
{
-
return Select(a, first, priot - 1, i);
-
}
-
else//k < i
-
{
-
return Select(a, priot + 1, last, i - k);
-
}
-
}
-
-
void FindMaster(int a[], int length)
-
{
-
int mid = length/2;
-
int key = Select(a, 0, length - 1, mid);
-
cout << "中位数为:" << key << endl;
-
int count = 0;
-
for(int i = 0; i < length; i++)
-
{
-
if(a[i] == key)
-
{
-
count++;
-
}
-
}
-
if(count > mid)
-
{
-
cout << "主元素为:" << key << endl;
-
}
-
else
-
{
-
cout << "该数组中没有主元素" << endl;
-
}
-
-
}
-
-
int main(int argc, char* argv[])
-
{
-
int a[MAXNUM];
-
int length;
-
cout << "请输入数组元素个数:";
-
cin >> length;
-
for(int i = 0; i < length; i++)
-
{
-
cin >> a[i];
-
}
-
cout << "输入的元素如下所示:" << endl;
-
for(int i = 0; i < length; i++)
-
{
-
cout << a[i] << " ";
-
}
-
cout << endl;
-
-
FindMaster(a, length);
-
-
return 0;
-
}
时间复杂度分析:由于查找中位数的平均复杂度为O(n),然后遍历一次数组,进行判定,时间辅助度为O(n)。所以,总的时间复杂度为O(n)+O(n) = O(n)。
(2)无序关系时求主元素的O(nlogn)算法
若T 中存在主元素,则将T 分为两部分后,T 的主元素也必为两部分中至少一部分的主元素,因此可用分治法。
将元素划分为两部分,递归地检查两部分有无主元素。算法如下:
a. 若T 只含一个元素,则此元素就是主元素,返回此数。
b. 将T 分为两部分T1 和T2(二者元素个数相等或只差一个),分别递归调用此方法求其主元素m1 和m2。
c. 若m1 和m2 都存在且相等,则这个数就是T 的主元素,返回此数。
d. 若m1 和m2 都存在且不等,则分别检查这两个数是否为T 的主元素,若有则返回此数,若无则返回空值。
e. 若m1 和m2 只有一个存在,则检查这个数是否为T 的主元素,若是则返回此数,若否就返回空值。
f. 若m1 和m2 都不存在,则T 无主元素,返回空值。
(3)无序集的主元素问题的线性时间算法
这个问题可以采用《编程之美》上“寻找发帖水王”的方法。如果每次删除两个不同的数字(不管是否包含主元素的数字),那么在剩下的数字中,主元素的出现的次数仍然超过总数的一半。可以通过不断的重复这个过程,转化为更小的问题,从而得到答案。
代码如下所示。
-
void Find(int a[], int length)
-
{
-
int candidate;
-
int i, ntimes;
-
i = 0;
-
ntimes = 0;
-
-
for(i = 0; i < length; i++)
-
{
-
if(ntimes == 0)//计数为0时,读入新的元素,计数加1
-
{
-
candidate = a[i];
-
ntimes = 1;
-
}
-
else
-
{
-
if(candidate == a[i])//如果数据相同,计数加1
-
{
-
ntimes++;
-
}
-
else
-
{
-
ntimes--; //如果计数不同,则计数减1,相当于删除了两个元素
-
}
-
}
-
}
-
-
int count = 0;
-
for(i = 0; i <length; i++)
-
{
-
if(candidate == a[i])
-
count++;
-
}
-
//最终得到的candidate元素有可能是序列最末位的两个元素之一
-
//因此,需要验证
-
if(count > length/2)
-
{
-
cout << endl << "主元素为: " << candidate << endl;
-
}
-
else
-
{
-
cout << "没有主元素." << endl;
-
}
-
}
时间复杂度分析:遍历一次数组需要O(n)的时间,所以总的时间复杂度为O(n),且只需要常数的额外内存。
参考:《算法设计实验题解》、http://blog.sina.com.cn/s/blog_4ae8f77f0100uptr.html,感谢这位朋友的思路。
梦醒潇湘love
2013年4月16日 14:22
阅读(8994) | 评论(0) | 转发(0) |