Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1184256
  • 博文数量: 398
  • 博客积分: 10110
  • 博客等级: 上将
  • 技术积分: 4055
  • 用 户 组: 普通用户
  • 注册时间: 2007-12-23 20:01
个人简介

新博客http://www.cnblogs.com/zhjh256 欢迎访问

文章分类

全部博文(398)

文章存档

2012年(1)

2011年(41)

2010年(16)

2009年(98)

2008年(142)

2007年(100)

我的朋友

分类: IT业界

2007-12-31 10:23:15

   年初把Hyperion收购了,最近又把BO收购了,把收购了。从目前的一些行业分析报告来看,Oracle和总体看好。  

diversity

BID 

Market Leader Analysis

  从数据库来看,SQL Server显然不适合VLDB。Oracle的分区,索引,ASM,集群等特性,作为数据仓库应用合适。虽然SQL Server也有集群、分区等,但于Oracle DB比还不是一个档次的。SQL Server的数据仓库体系中,SSAS是非常有创新部分,特别是UDM的概念,使传统的数据仓库结构发生了很大的变化,很多情况下可以将SSAS的作为一个数据集市满足需求。SQL Server的数据库引擎还是非常传统的关系型数据库,所以SSAS是一个独立的组件。而Oracle DB算是一种混合数据库,比如它可以有嵌套表;Dimension是一种类型,可以定义层次……Oracle的聚合查询可以使用物化视图,不必像SQL Server那样一定要通过SSAS的实现。

  通过收购,Oracle用一大堆的商业软件,其技术资源和市场资源都是它的优势。但是它的产品布局似乎有问题。比如它的ETL工具,那个ODI似乎也是Oracle收购过来的,以前有朋友跟我说不要用OWB了,ODI才是未来的主打产品。不过现在看来OWB似乎才是主打,但是Siebel BI和Hyperion的产品中,又使用了Informatica的产品。OLAP方面,Hyperion的Essbase跟Oracle DB中的OLAP显然不是一路货色,两者基本上不可能整合到一起。

  在收购Siebel之前,Oracle还没有专业的BI工具,所以现在的Siebel BI被改名叫Oracle BI。但不知道Hyperion被Oracle收购后命运如何,Hyperion的强项是OLAP,绩效管理和财务方面的应用,但是某些功能模块跟Oracle原有体系的重合或者不相容,不知是否会被抛弃。可能性之一就是发展多套产品线,比如Oracle DB原有的OLAP,OWB,DataMining等,作为数据仓库的组件之一免费供应,就像SQL Server那样,而Siebel BI和Hyperion作为两套独立的BI产品。另一种可能性就是让Siebel BI作为专门的Operational BI,将Hyperion发展为专门的绩效管理工具。

  Microsoft的PerformancePoint正式版本我还没时间安装,CTP2和CTP3我是看过的,总体感觉还是比较简单的。另外还有两个在开发中的组件,一个好像是Management Reporter的,一个是Data Integration的,目前都是CTP2版本。

从容量上对比一下Microsoft PerformancePoint和Hyperion Performance Management:

  Microsoft PerformancePoint一共96MB。

  Hyperion Performance Management,包括65个打包的zip文件,Windows和Linux版本一共20.4GB。

  在看看Siebel BI和Oracle DB 11g:

 

  Microsoft的DW / BI包括SQL Server,Excel,PerformancePoint,最多再加上SharePoint。光从容量上来看,Microsoft的内容只有Oracle的十几分之一。

  Oracle的另一优势就是跟其他商业软件整合。不过现在微软也有自己的Dynamics系列。比如Microsoft Dynamics CRM和Oracle Siebel CRM:

  800MB。

  Linux版本15G。

  800 : 15000就是Microsoft和世界第一CRM的差距。

  ETL工具最近用的是Informatica PowerCenter 8.1.1。总体来说,PowerCenter和SSIS各有各的优缺点。从易用性来说,Informaitca有四个开发管理组件,初学者可能不知道如何下手,所以关键先要了解PowerCenter的开发流程。SSIS有BIDS和SSMS,主要的开发工作在BIDS上完成,但是BIDS是基于Visaul Studio的,如果是没有做过.NET开发的人员,VS的复杂的开发环境可能让他们不知所措,但是对于熟悉VS的开发人员来说,通过VS,他们可以使用更多的资源,比如源管理器,VSTFS等。从界面的人性化上看,SSIS无疑更好,这是Microsoft的一贯特色,PowerCenter有些地方连右键菜单都没有。

  SSIS的数据流如同PowerCenter的Mapping,SSIS的控制流如同PowerCenter的Task,SSIS的Package如同PowerCenter的WorkFlow。PowerCenter的Mapping和WorkFlow分开开发,在一个大型开发团队中,开发人员开发Mapping,而有管理人员将多个Mapping在WorkFlow中统一调度。但如果是只有几个人的开发团队中,这种模式的效率就不如SSIS了,因为小型团队中每个人都独立工作,开发人员需要开发好Mapping后,再在WorkFlow建立Session,需要再一次为Session配置连接和参数。相反,SSIS不适合多人开发,因为不像PowerCenter将Mapping和WorkFlow分开开发,所以当一个人在开发Package时,其他人就插不上手。

  SSIS的运行监控是非常棒的设计,可以看到数据流的执行情况。如果数据流出问题,可以马上知道在那个转换组件上发生了问题。而PowerCenter的Monitor只能看到源和目标的情况,一旦出状况,就只能看日志了,但在日志大量的文本里,很多时候是找不出问题的所在。除了执行时监控外,SSIS在开发时可以动态的Validate,而且它的Validate也严格得多。只要发现字段类型对应不上就会报错。PowerCenter中Port的对应比较自由,比如一个Output的Port可以随意对应到多个Input的Port,而SSIS中一定要用多播组件才行。所以在数据质量方面,SSIS比PowerCenter更有保障,PowerCenter最郁闷的是,报错后却找不到出错的地方。

  就组件的功能上,SSIS比PowerCenter要丰富,像SSIS控制流的循环组件,数据流中的模糊查找、词频计算、数据挖掘评分等组件都是Informaitca没有的。特别是有很多针对SQL Server组件。如果使用非SQL Server数据库的话,SSIS功能上要打个七折。

  SSIS最致命的问题是数据库连接的兼容性上,数据流中很多组件只认OLE DB连接,而且只有OLE DB数据源组件才可以加参数,这显然是Microsoft有意为之。加上SSIS的Validate比较严格,所以连接到那些对OLE DB兼容不好的数据库就会报错,像我之前连接Oracle 9i就碰到这样的问题。PowerCenter支持更多的数据源,此外还可以连接SAP, PeopleSoft等商业软件,在大型企业中,这些功能是非常方便的。  

 

阅读(1460) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~