2011年(103)
分类: 数据库开发技术
2011-05-04 23:01:01
在Oracle中模拟数据是非常简单的一件事情。
Oracle首先提供了一个dual的虚表
其次提供了一个Connect by语句,实现了虚表数据列的模拟
最后Oracle提供了强大的DBMS_RANDOM包进行相关随机数的产生。
SELECT TRUNC(DBMS_RANDOM.VALUE(1,101)), DBMS_RANDOM.string('~',5), DBMS_RANDOM.string('l',5), DBMS_RANDOM.string('L',5), DBMS_RANDOM.string('a',5), DBMS_RANDOM.string('A',5), DBMS_RANDOM.string('u',5), DBMS_RANDOM.string('U',5), DBMS_RANDOM.string('x',5), DBMS_RANDOM.string('X',5), DBMS_RANDOM.string('p',5), DBMS_RANDOM.string('P',5) from ( SELECT level,ROWNUM rn FROM DUAL CONNECT BY ROWNUM<=1001 ) |
相比而言,SQLServer则没那么幸运了,首先没有虚拟的概念,则需要构建一个物理表以存储需要模拟的次数,再次需要使用CTE递归来模拟一个虚表数据,最后才通过相关随机函数进行构建数据。
--创建一个物理表,并插入要模拟的次数,最大不能超过32767
CREATE TABLE RandTable ( MaxNumber INT CHECK (MaxNumber >= 0 AND MaxNumber<=32767), ) INSERT INTO RandTable values(32767); |
--使用CTE递归构建列数据
WITH AutoSequence(MaxNumber,Identiy) AS ( SELECT e.MaxNumber,1 AS Identiy FROM RandTable AS e UNION ALL SELECT e.MaxNumber,Identiy+1 c FROM RandTable AS e,AutoSequence d WHERE d.Identiy ) |
--用时间+递增值做种子进行RAND
SELECT LEFT(NEWID(),4), RAND((DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE())), RAND(Identiy+(DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE())), CAST(RIGHT(CAST(RAND(Identiy+CAST(GETDATE() AS INT)) AS VARCHAR(100)),2) AS INT), CAST(RIGHT(CAST(RAND(Identiy+(DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE())) AS VARCHAR(100)),2) AS INT) FROM AutoSequence OPTION (MAXRECURSION 32767); SELECT LEFT(NEWID(),4), CAST(RIGHT(CAST(RAND(Identiy+CAST(GETDATE() AS INT)) AS VARCHAR(100)),2) AS INT) FROM AutoSequence OPTION (MAXRECURSION 32767);
|
小结:
使用CTE递归和SQLServer随机函数还是存在很多问题的。
1、一定需要构建一种物理表
2、CTE递归限制在0到32,767之间
3、RAND产生的随机数比较集中,通过时间+递增值的方式来实现的话,只能截取后几位,导致无法控制随机值的区域。
4、NEWID()产生的随机数为字符和数字混杂,也不能得到预期的效果