各位CUer & PostgreSQLer:
这是一个想法,发出来是想听听数据库版资深人士的建议。今年上半年要实施,年底要以新系统开展统计工作。
目前正在经历着一个困难:每年年底大约有8k工作人员进行以件为单位的数据统计工作。各物件数据分布存储在8K个部门(1个一级部门,10个二级部
门,160个三级部门,4~6级部门约7900个,共6级)的数据库中,数据库主要是MSSQL(约8K个MSSQL2000/2003+
Windows2000/2003Server),数据库的结构基本一致。现在的统计方法是每到年底,各个部门按统一的要求将各物件信息统计汇总(统计结
果能看到6级部门的分类汇总信息,每级约计1,600条分类汇总信息),最后形成统计数据,历时约三个月。这种方法费时费力,效率极低。
简单的想法:
1. 能否将这六个层次的数据存储在一个数据库中?
我感觉这是可行的,但不知效率如何,硬件的需求如何?
2. 或建立11个数据中心(1个为一级部门使用,其余10个二级部门使用。)1个做为中心数据库,专为日常分析统计用。10个安装在不同地区,存储收集各物件数据,每天通过网络向数据中心数据库同步信息,不要求实时传送数据。
愿意听到各位大家的各方面的建议:
1. 数据库选型的建议;
2. 操作系统选型的建议;
3. 统计分析软件选型或开发语言的建议;
4. 数据仓库与数据挖掘技术的建议;
5. 数据迁移的建议;
6. 数据存储与备份的建议;
7. 其它建议。
再次对认真阅读本贴内容的人士和回贴的人士表示感谢!
注:信息以件为单位,目前每物件信息分布在82个表(统计信息分布在300个表中)中,每件信息约占10M的存储容量,共有40,000,000件,每物件数据信息平均保存75年,希望能得到相关建议。
阅读(1041) | 评论(0) | 转发(0) |