一道位运算的算法题-王贤才-ChinaUnix博客

oops

首页　| 　博文目录　| 　关于我

王贤才

博客访问： 1265135
博文数量： 573
博客积分： 0
博客等级：民兵
技术积分： 66
用户组：普通用户
注册时间： 2016-06-28 16:21

文章分类

全部博文（573）

数据存储和恢复（2）
kernel+相关机制（53）

内核模块机制（3）

内核同步机制（2）

内核中断机制（3）

内核定时机制（2）

电源管理（5）

Linux IO（1）

netlink机制（2）

uio机制（1）

内核输入子系统（3）

platform机制（0）

内核读写文件（2）

initrd机制（1）

系统调用（7）

工作队列（2）

内核调试（5）

内核源码分析（7）

内核试题（2）

设备模型（1）

内核makefile（1）

其他（3）
kernel+设备驱动（48）

cdp驱动（8）

linux块设备驱动（1）

SCSI_target驱动（11）

SPI驱动（1）

IIC驱动（9）

DMA驱动（1）

LCD和触摸屏驱动（2）

内核+驱动移植（1）

应用程序移植（1）

设备驱动和管理（5）

PCI驱动（2）

编写驱动环境准备（6）
kernel+文件系统（23）

VFS（2）

根文件系统（1）

sysfs文件系统（4）

proc文件系统（5）
kernel+内存管理（26）
kernel+网络接口（4）
kernel+进程调度（11）

内核进程（2）

完成量（1）

内核线程（2）
kernel+进程通信（0）
Android系统（0）
嵌入式开发板（34）

S3C2440裸机驱动（15）

ARM体系结构（8）

硬件+原理图（2）

单片机（2）

bootloader（7）
linux系统编程（78）

socket编程（17）

IPC机制（5）

信号（8）

进程控制和管理（9）

线程控制和管理（6）

文件操作（11）

日期时间（3）

libxml2库（9）

系统相关（7）

其他系统调用API（3）
C/C++编程（47）

标准C语法（27）

标准C库函数（13）

GNU C语法（2）

C试题（2）

c++语法（3）
数据结构+算法（51）

排序和查找（2）

B树（0）

二叉树（4）

八皇后（1）

红黑树（3）

赫夫曼树（0）

Hash表（2）

队列（2）

栈（4）

链表（4）

字符串（3）

大整型数（1）

算法题（5）

其他（18）

位操作（1）
系统架构（11）

nginx（9）

zabbix（1）

apache（1）
辅助编程（115）

linux命令（26）

shell脚本（20）

编译链接（14）

动态库静态库（11）

TUXEDO（2）

thrift（10）

xpcom（12）

cmake（1）

makefile（2）

SVN（5）

vim（7）

source insi（1）

doc命令（1）

aix命令（3）
汇编编程（25）

ARM体系汇编（12）

X86体系汇编（11）

c内嵌汇编（1）

反汇编（1）
python编程（3）
java编程（0）
数据库（5）

C嵌入SQL（2）
《内核设计与实现（20）
IT杂谈（17）
未分配的博文（0）

文章存档

2018年（3）

2016年（48）

2015年（522）

我的朋友

相关博文

一道位运算的算法题

分类： C/C++

2015-12-03 13:49:08

作者：四火的唠叨（@RayChase）

网址：

点击“阅读原文”，加入伯乐在线作者团队

最近遇到这样一道算法题：

Given an array of integers, every element appears three times except for one. Find that single one.

一组整数，除了一个只出现一次以外，其他每个整数都恰好出现三次，要寻找那个特殊的整数。

似曾相识

首先，它让我想起了另外一道类似的题目，如果把上面的“恰好三次”，改成“恰好两次”，寻找那个特殊的整数，又该怎么解？

那样的话，我希望找到一个方法，让两个相同的数进行运算以后，能够泯灭掉，这样所有的数进行运算，剩下的值就是那个特殊的数。恰好有这样的方法，这个方法就是“异或”：

public int singleNumber(int[] A) {

int total = 0;

for (int a : A)

total ^= a;

return total;

}

通用算法

“恰好两次”恰好有“异或”来解，现在“恰好两次”变成了“恰好三次”，推广一点说，如果是“恰好N次”，该怎么解？

通用的算法中，用一个HashMap可以得到复杂度近似为n的解法，key为数字本身，value计数，到三次的时候delete掉这个entry，循环完成以后整个HashMap中剩下的就是那个特殊的整数了。这个解法普普通通，没有叙述的必要。这个方法可以保证“恰好N次”一样解决。这个算法很简单，就不写出来了。

另外一个思路，借由位操作，对于整数32位，对于每一位，整个数列的数加起来去取3的余数，就是那个特殊的数在该位上的值。这个方法也可以保证“恰好N次”一样能够被解决：

public int singleNumber(int[] A) {

int ret = 0;

for (int i = 0; i < 32; i++) {

int c = 0, mask = 1 << i;

// ① mask, 第i位为1，其他位都为0

for (int j = 0; j < A.length; j++) {

int val = (A[j] & mask);

if ( val>0 || val<0 ) {

// ② 如果该数在这一位上为1，计数器就加一

c++;

}

}

if (c%3 > 0)

// ③ 这一位的计数除以3取余数，在这里只可能为0或1

ret |= mask;

}

return ret;

}

关于补码

但是，我在一开始实现这个算法的时候，在上面代码中②的位置，我漏掉了val<0的情况，因为第一印象告诉我，一个正整数去与上一个掩码数，会得到一个正整数。但是这是错误的印象。比如在参数A等于{ -1, -1, -2, -1 }的时候，漏掉val<0的结果等于一个荒唐的2147483646。

这是为什么呢？

因为负数在内存中是以补码方式存放的，第一位最高位是符号位，0表示正数，1表示负数，仅当表示负数的时候，余下的31位等于那个数的数值每一位都取反，然后加1。例如-1，这32位数是：

// 取反加一前：

1（符号位）000 0000 0000 0000 0000 0000 0000 0001

// 取反加一后：

1（符号位）111 1111 1111 1111 1111 1111 1111 1111

32位整数的范围是从-2147483648到2147483647，为何负值比正值能表示的数多一个，就在于这个“加一”（表示0的时候符号位是0，相当于表示0的时候占用了正数的表示法）。

所以，如果漏掉了上面代码中val<0的情况，在执行到i=31的循环的时候，掩码mask即1<

// 即

1（符号位）000 0000 0000 0000 0000 0000 0000 0000

// 如果按照“取反加一”的规则，它是由它自己取反加一而来的，发生了溢出

1（符号位）000 0000 0000 0000 0000 0000 0000 0000

所以这个数也是补码表示的负数中，最特殊的一个。

那为什么上面说漏掉val<0之后算错的结果是2147483646呢？

这个实际要求解的数-2在内存中的表示是这样的：

// 取反加一前：

1（符号位）000 0000 0000 0000 0000 0000 0000 0010

// 取反加一后：

1（符号位）111 1111 1111 1111 1111 1111 1111 1110

// 符号位错误：

0（符号位）111 1111 1111 1111 1111 1111 1111 1110

由于前面说到的，符号位错误了，变成了正数，而正数的表示法可不是补码表示，所以得出了2147483646这个数。

借助两个数的每一位存储信息

下面这个方法稍微有点难理解，而且很容易写错。需要两个数（one和accumulation），因为一个数在每一位上面无法存放超过两次同样的数出现的信息。每次循环中，需要先标记出现，然后再清零出现过三次的标志位。最终one留下的每一位都是无法清零的，即出现次数不是3的整数倍的。

public int singleNumber4(int A[])

{

int one = 0;

// 出现一次的标志位

int accumulation = 0;

// 积累标志位

for (int i = 0; i < A.length; i++)

{

accumulation |= A[i] & one;

// 只要第二次或者以上出现，就为1

one ^= A[i];

// 出现奇数次保留，偶数次抛弃

int t = one & accumulation;

// 第三次的时候one和accumulation都保留了该位的值

one &= ~t;

// 清零出现三次的该位的值

accumulation &= ~t;

}

return one;

}

其实，这道题还有许多其他做法，既包括利用位运算的其他做法，也有那种“先排序，然后再寻找特殊数”这样突破常规想法的解法（其实我觉得先排序这样的做法很好啊，虽然复杂度稍微高一些（取决于排序的时间复杂度了），但是清晰，而且通用性更好。方法虽然简单，但是我大概受到的教条式思维太严重了，这样的方法根本没有想到……）。

阅读(391) | 评论(0) | 转发(0) |

上一篇：有或无操作系统的Linux设备驱动区别

下一篇：C语言宏中"#"和"##"的用法

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6