Chinaunix首页 | 论坛 | 博客
  • 博客访问: 325095
  • 博文数量: 23
  • 博客积分: 1961
  • 博客等级: 上尉
  • 技术积分: 1035
  • 用 户 组: 普通用户
  • 注册时间: 2004-10-12 15:51
文章分类

全部博文(23)

文章存档

2014年(1)

2011年(1)

2010年(18)

2009年(3)

分类: Mysql/postgreSQL

2009-06-12 15:15:08

最近工作需要研究了一下kettle的使用。
从安装说起,下了个3.2版本安装,发现不用安装。。。直接点spoon.bat报错not find the main class
郁闷极了,上他们官网论坛看看说不用安装,自己又调试.bat脚本环境变量,重新安装jdk1.6接不得要领。最后哥们过来一看,日下错包了,下的是源代码开发包,又重新下个rc包,执行kettle.exe搞定。

从设计理念来说,他属于开源的不错etl,数据流入流出都很方便,回忆起以前自己用php读数据库sqlserver,格式处理,再导入mysql那叫一个麻烦,有他就省心了,他支持多数常见的数据库类型,支持csv xml css excel等等数据格式,转化支持去重,数据联合,加行,加列,拆分,行列转换,居然还给了计算器和mail,牛逼大了。支持数据仓库的维度和联合处理,方便一大堆。

我主要就用到界面的job系统,从文件和数据库导入,处理,导入另外一个数据库,说专业了就是数据库集群的异步同步,通过trigger+kittle很容易实现了一般数据量的交互。

例子就不说了,他有个cn的html说明 说的很清楚了。
阅读(4035) | 评论(2) | 转发(0) |
给主人留下些什么吧!~~

chinaunix网友2009-08-14 15:36:42

楼上什么意思? 1.一个库中多个表导入另一个库? 2.还是对多个表做转化处理一类的 然后倒入一个表? 1显然可以 2也可以,我正在做测试

chinaunix网友2009-07-01 16:57:59

“我主要就用到界面的job系统,从文件和数据库导入,处理,导入另外一个数据库,说专业了就是数据库集群的异步同步,通过trigger+kittle很容易实现了一般数据量的交互。”用它能处理 多个有关联的表的实时同步到另一个数库中吗? 盼望指教:ypfkl@126.com