Chinaunix首页 | 论坛 | 博客
  • 博客访问: 12731
  • 博文数量: 10
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 110
  • 用 户 组: 普通用户
  • 注册时间: 2014-12-23 15:56
文章分类

全部博文(10)

文章存档

2014年(10)

我的朋友

分类: 数据库开发技术

2014-12-23 17:09:34

数据仓库的定义


数据仓库是一个面向主题的,集成的,相对稳定的,反应历史变化的数据查询决策系统。


面向主题:

操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分区,而数据仓库的数据是按照一定的分析主题域进行组织。

主题是在较高层次上将企业信息系统中的数据进行综合,归类分析利用的一个抽象概念。
集成的:

是对多个分散的数据源的数据抽取,清理的基础上经过系统加工,汇总整理得到的。必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致性全局信息。

相对稳定的:

数据面向查询决策,通常数据被长期保留下来,修改和删除的操作很少,通常只需要定期的加载和刷新

反应历史变化的:

保存历史信息,系统记录了企业从过去某一时点到目前的各个阶段的信息。通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。


数据仓库组成

数据库
ETL
数据展示工具
元数据

什么是数据仓库的元数据?

元数据是指描述数据的数据,即描述数据仓库内数据的数据。
包括ETL的抽取时间,源数据到目标表的映射等等此类描述数据。



数据仓库的设计步骤

包括
数据库的设计
ETL设计
数据展现设计

数据库设计:

1.根据分析的主题确定数据源。
2.数据库的层次设计
3.各层次目标表结构的设计,及索引分区策略。

ETL设计:

数据的抽取,转换,加载的策略。

数据展现设计:

1.复杂表格或者图形化展示
2.数据查询范围限制,权限设置。

阅读(259) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~