乱序算法及C++函数-laoliulaoliu-ChinaUnix博客

miraclemiracle.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

laoliulaoliu

博客访问： 4662334
博文数量： 1214
博客积分： 13195
博客等级：上将
技术积分： 9105
用户组：普通用户
注册时间： 2007-01-19 14:41

个人简介

C++,python,热爱算法和机器学习

文章分类

全部博文（1214）

cloud（3）
operation（9）
tornado（4）
mac_os（1）
golang（4）
架构（13）
git（4）
security（29）
shell（1）
macbook（1）
ruby（13）
javascript（15）
design（3）
testing（1）
mac（1）
bigdata（69）
nosql（46）
R（9）
gcj/acm（6）
NLP（10）
小说（3）
matlab（4）
web（44）
java（66）
product（7）
c#（1）
language（4）
machine learning（76）
science（4）
opencourse（2）
windows（3）
search（33）
algorithm（65）
database（51）
compiler（11）
ACE（5）
poem（1）
programming（29）
python（140）
assembly（1）
linux（49）
C++（16）
book（2）
cate（1）
phliosophy（3）
mental（30）
Science fiction（1）
Software（5）
c（23）
network（65）
CS（15）
thinking（10）
BSD（13）
solaris10（2）
life（57）
Debian（16）
economy（7）
Mathematics（57）
OS（8）
ibm（2）
gentoo（32）
未分配的博文（8）

文章存档

2021年（13）

2020年（49）

2019年（14）

2018年（27）

2017年（69）

2016年（100）

2015年（106）

2014年（240）

2013年（5）

2012年（193）

2011年（155）

2010年（93）

2009年（62）

2008年（51）

2007年（37）

我的朋友

最近访客

推荐博文

乱序算法及C++函数

分类：

2012-01-15 01:09:29

文章来源：http://hi.baidu.com/lujunqianglw/blog/item/270401ade85f891e4a36d6dc.html

转载自

最终编辑

我们经常看到排序的算法，但有的时候，也需要将某个有序的序列打乱顺序，就叫“乱序”吧。
按排序的定义，“乱序”应该是这样的：将一组记录（或者元素，本身可以是有序或者无序的）按照某
个域的值（称之为“排序码”）的随机次序重新排列的过程。
这里我们注意到无论是排序还是乱序，都是按某个域的值进行的。比如我们将一组数据存放在
某个数组中，需要进行乱序，则只需要将数据下标（1-N）进行乱序后，再依次输出数组的内容，就可以
达到乱序的目的了。
一提到随机，当然免不了需要用到随机函数，这里并不打算讨论随机的深入算法，只说明随机
函数在乱序算法中的使用。随机函数一般都不是真正的随机，而是通过算法在某个范围内按某个分布函
数生成的随机数。在VB中，Rnd()函数可以生成0-1之间的随机小数，然后再通过运算得到想要的分布范
围；在C++中，使用rand()函数可以生成0-RAND_MAX（0x7ffff)之间的整数，也同样需要经过运算。当然
为了每次生成的随机数不同，在VB中使用Rnd()函数之前，要先用Randonize time 语句，使用当前时间作
随机种子；而在C++中，则可以用 srand((unsigned)time(NULL)); 来设置随机种子。要说明的是，随机种
子语句一般只用一次，多次使用反而会使随机函数"不随机"了。这里仅以C++为例，来写一个自定义的函数，
这个函数的作用是，输入整数a和b，随机生成[a,b]之间的整数（Echo注：这个[a,b]是指区间，即生成的数
是包含a和b的）。

//生成a,b 之间的随机整数
int Random (int a, int b)
{
int area=0;
int ret=0;
//生成区间
area=b-a+1;
ret=(int)(rand()*area/(1.0 * RAND_MAX)+a);
return ret;
}

说完了随机函数，我们再来看看如何乱序。假设我们先把需要乱序的数保存在一个数组A中，另外
建一个与A数组一样大小的数组B，来存放乱序后的结果。
算法一：这是经常看到的算法
(1)从A中随机抽取一个数；
(2)查一下B中是否已经有这个数
(3)如果B中没有，则把这个数放到B中；如果有表示重复了,再回到(2)
(4)直到B中的数组满了,结束;

这里存在两个问题：
1、在步骤（2）中去检查已经随机抽出来的数是不是有被抽过，这本身就存在问题，因为有可能在A中某个数
本身就是出现多次，比如这样一个序列："1,2,4,5,2,3,4,7,22" 数字2和4都出现的2次。所以这种判断方式只能
用于不出现重复的情况；
2、设想一下随机抽取最后一个数的情况，假设一个序列“1,2,3,4,5,6,7" 随机抽取6次后得到"5,3,1,2,4,7"
就剩下最后一个数字6了，但是这时在第（1）步中是随机抽取一个数，程序会在1-7中随机选择一个数，有可能
重复了很多次后仍没有选出6这个数，但实际上，这时已经不需要再随机了，只有6才可以被抽取。
通过算法一我们可以看出乱序不能以抽取的数据内容作为标准，而应该是这样一种方式：先将需要乱序
的数放到临时数组A中，然后:
算法二:
(1)从A中随机抽取一个数K，并放入B中；
(2)从A中把K删除；
(3)回到第（1）步，直到A中为空
使用这种方式，可以不需要理会A中数据是否重复，同时，每次到步骤（2）后，A中的数据个数就少1，也不需要
进行判断。这其实也符合实际生活中我们打乱顺序的过程：随机抽一张牌，放到外面；再随机抽一张牌，放到原
刚才那张的上面，直到结束。
让我们看看C++的程序，下面的程序是给直接在数组中进行乱序，每次随机选择一个位置，把它与最后一
个位置的数据对换，直到结束。

//生成0-n不重复的随机数字
void GetRand(int n,int arr[])
{
int i;
int p;
int tmp;
for (i=0;i<=n;i++)
{
arr[i]=i;
}

for (i=n;i>0;i--)
{
   p=Random(0,i);
   tmp=arr[p];
   arr[p]=arr[i];
   arr[i]=tmp;
}
}

在主程式调用上面函数时，需要先用 srand((unsigned)time(NULL));语句来设置随机种子。生成随机数组后，
即可使用下标的方式引用数据了。测试的主程式没有写，有兴趣的朋友可以自己完成，其实只要输出arr[]的值
就看以看到乱序后的结果了。
Echo备注：GetRand函数里没有检查arr[]的大小，有可能会出现错误，请保证arr下标为0-n,即大小为n+1。

阅读(2498) | 评论(0) | 转发(0) |

上一篇：机器学习中的数学(3)-模型组合(Model Combining)之Boosting与Gradient Boosting

下一篇：NumPy-快速处理数据

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6