数组中重复的数字-renjian2011-ChinaUnix博客

蝈蝈的足迹

首页　| 　博文目录　| 　关于我

renjian2011

博客访问： 247950
博文数量： 62
博客积分： 973
博客等级：准尉
技术积分： 530
用户组：普通用户
注册时间： 2011-11-16 23:25

文章分类

全部博文（62）

Linux学习（7）
C/C++（14）
内核学习（4）
程序人生（3）
常见算法（29）
未分配的博文（5）

文章存档

2013年（1）

2012年（14）

2011年（47）

我的朋友

相关博文

数组中重复的数字

分类： C/C++

2011-11-20 14:02:20

来自互联网，有改动。

问题：数组a[N]，1至N-1这N-1个数存放在a[N]中，其中某个数重复一次。写一个函数，找出被重复的数字。时间复杂度不超过O(n)。

一、数学推导法

不重复时 sum = 1+2+...+ d + (d+1)...+N；现在less = 1+2+...+ d + d + (d+1)+...+(N-1)。

sum 和 less都有N个数，由于less中只有一个重复的数字d，则必有1 <= d <= (N-1)，sum > less。

sum - less = 0+0+...+ 0 + (-d) + 0...0 + N = ( N - d ) 。所以重复的d = N - (sum - less)。

二、标志数组法

设数组a[n] = {2,3,2,1}，2是重复数字。

把一个数组b[]初始化为"0000"，对a[]访问一位在b[]上标记一位，再次访问到时查看标志位已经被置1则发现重复。空间复杂度O(n)。

遍历时，a[0]=2，令b[2]=1，"0010"；a[1]=3，令b[3]=1，"0011"；a[2]=2，b[2]已经==1，找到a[2]。

int do_dup(int arr[],int NUM)
{
int i = 0;
int *arrayflag = malloc( NUM * sizeof(int) );
while(i++ < NUM)
arrayflag[i] = 0;
for(i=0; i<NUM; i++)
{
if( 0 == arrayflag[ arr[i] ] )
arrayflag[arr[i]] = 1; // 置出现标志
else
break;
}
free(arrayflag);
return arr[i];
}

三、固定偏移标志法

同样是访问过后做标记的思想，为克服申请了O(n)的空间的缺陷，充分利用a[N]本身值和下标的关系来做标记，把标记直接放到数组内的数值上再清除标记。时间O(n)=N，空间O(n)=1。

a[N]，里面是1至N-1。原数组a[i]最大是N-1，若a[i]=K在某处出现后，将a[K]加一次N，做标记，当某处a[i]=K再次成立时，查看a[K]即可知道K已经出现过。a[i]在程序中最大也只是N-1+N=2N-1。注意防止值溢出。

以数组{2,3,1,2}为例。所谓固定偏移，有点间接寻址的意思 :)。

a[0]=2 < 4，未标记，K=2， a[2]=1 < 4，做标记，让a[2]= a[2]+4 = 5； a[1]=3 < 4，未标记，K=3， a[3]=2 < 4，做标记，让a[3]= a[3]+4 = 6； a[2]=5 >= 4，还原K=a[2]-4=1，a[1]=3 < 4，让a[1]= a[1]+4 = 6； a[3]=6 >= 5，还原K=a[3]-4=2, a[2]=5 >=4，不能还原，发现重复，返回a[3]=2。

下边的实现可能改变了原数组，需要恢复处理。