informatica etl开发流程
1. 配置资料库将使用的数据库连接,安装相关客户端,如oracle client,tns配置;
2. 安装服务器,记录用来创建资料库的用户名、密码,资料库本身的用户名、密码;
3. powercenter客户端安装;
4. 打开repository manager;
5. 添加一个资料库,资料库名称是在安装服务器时指定的名称,默认为powercenter;用户名为创建资料库所用的数据库用户名或informatica自带的管理员帐户;
5. 双击资料库连接到该资料库;
6. 第一次连接时连接设置区域的domain可能为空,可以通过单击add来添加,域名,网关主机和网关端口分别是安装服务器时指定的域名,节点名和端口,见服务器安装日志;
7. 使用创建资料库的用户连接到资料库;
8. 使用repository manager创建一个用于开发组;
9. 分配相应的权限;组默认创建的时候具有下列权限:
?浏览资料库
?使用 Designer
?使用 Workflow Manager
?使用 Repository Manager
一般来说,这对于普通开发权限已足够;
10. 创建用户,记录用户名和密码;
11. 分配用户到相应的组;
12. 创建一个文件夹,其主要是用于简化存储于资料库中的对象的管理,通常每个项目设置一个、多个文件夹。其逻辑形式和数据库中的模式类似;
13. 开发的前期工作已经完成,步骤4到11在repository manager中完成,通常是informatica管理员执行这些任务;
14. 在安装了客户端的机器上配置etl开发涉及到的数据库的odbc数据源;
使用Workflow Manager配置好关系数据源连接和目标连接;
15. 列出etl映射所用到的所有源表和字段;
16. 列出etl映射所用到的所有目标表以及错误日志表和字段;
17. 确定映射规则,包括过滤、聚合、更新;
找到SQL对应的informatica转换;
18. 文档化映射规则;
19. 进入正式开发阶段;
20. 打开designer,使用分配的帐号连接到响应的资料库;
21. 使用source analyzer导入所有源表;
22. 使用target designer导入或产生所有的目标表;
23. 上面两步由于要读dd,所以首先需要具有相关权限,其次尽量不要选错,否则会浪费很多时间;
24. 创建相应的转换即可;
25. 到此为止etl开发就算结束,接下去要做的就是建立Workflow,该日继续;
阅读(2739) | 评论(0) | 转发(0) |