Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1207201
  • 博文数量: 398
  • 博客积分: 10110
  • 博客等级: 上将
  • 技术积分: 4055
  • 用 户 组: 普通用户
  • 注册时间: 2007-12-23 20:01
个人简介

新博客http://www.cnblogs.com/zhjh256 欢迎访问

文章分类

全部博文(398)

文章存档

2012年(1)

2011年(41)

2010年(16)

2009年(98)

2008年(142)

2007年(100)

我的朋友

分类:

2009-04-21 14:46:10

informatica etl开发流程
1. 配置资料库将使用的数据库连接,安装相关客户端,如oracle client,tns配置;
2. 安装服务器,记录用来创建资料库的用户名、密码,资料库本身的用户名、密码;
3. powercenter客户端安装;
4. 打开repository manager;
5. 添加一个资料库,资料库名称是在安装服务器时指定的名称,默认为powercenter;用户名为创建资料库所用的数据库用户名或informatica自带的管理员帐户;
5. 双击资料库连接到该资料库;
6. 第一次连接时连接设置区域的domain可能为空,可以通过单击add来添加,域名,网关主机和网关端口分别是安装服务器时指定的域名,节点名和端口,见服务器安装日志;
7. 使用创建资料库的用户连接到资料库;
8. 使用repository manager创建一个用于开发组;
9. 分配相应的权限;组默认创建的时候具有下列权限:
  ?浏览资料库
  ?使用 Designer
  ?使用 Workflow Manager
  ?使用 Repository Manager
  一般来说,这对于普通开发权限已足够;
10. 创建用户,记录用户名和密码;
11. 分配用户到相应的组;
12. 创建一个文件夹,其主要是用于简化存储于资料库中的对象的管理,通常每个项目设置一个、多个文件夹。其逻辑形式和数据库中的模式类似;
13. 开发的前期工作已经完成,步骤4到11在repository manager中完成,通常是informatica管理员执行这些任务;
14. 在安装了客户端的机器上配置etl开发涉及到的数据库的odbc数据源;
    使用Workflow Manager配置好关系数据源连接和目标连接;
15. 列出etl映射所用到的所有源表和字段;
16. 列出etl映射所用到的所有目标表以及错误日志表和字段;
17. 确定映射规则,包括过滤、聚合、更新;
    找到SQL对应的informatica转换;
18. 文档化映射规则;
19. 进入正式开发阶段;
20. 打开designer,使用分配的帐号连接到响应的资料库;
21. 使用source analyzer导入所有源表;
22. 使用target designer导入或产生所有的目标表;
23. 上面两步由于要读dd,所以首先需要具有相关权限,其次尽量不要选错,否则会浪费很多时间;
24. 创建相应的转换即可;
25. 到此为止etl开发就算结束,接下去要做的就是建立Workflow,该日继续;

 
阅读(2731) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~