Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1068535
  • 博文数量: 186
  • 博客积分: 4939
  • 博客等级: 上校
  • 技术积分: 2075
  • 用 户 组: 普通用户
  • 注册时间: 2010-04-08 17:15
文章分类

全部博文(186)

文章存档

2018年(1)

2017年(3)

2016年(11)

2015年(42)

2014年(21)

2013年(9)

2012年(18)

2011年(46)

2010年(35)

分类: Mysql/postgreSQL

2013-07-23 10:54:54

infobright是mysql的一个存储引擎,但跟传统的不同,它是以列
假如一个tab结构大致如下:

id name score

1   fu   100
2   huang 100

那么传统的数据库存储方式会是
1  fu 100 , 2 huang 100

列存储将是

1 2,fu huang, 100 100

在myisam/innodb都是第一种,

比如我要做data mining的时候,求sum(score)那么肯定是列的最快了,因为他们的在磁盘上存储区域很近。

而且infobright很多方便的地方,数据迁移可以stop service然后拷贝数据,start service.

压缩比非常之高,所以做BI分析是比较好的选择。缺点不支持mysqldump等。

只能select out 部分DDL/DML不支持。


适用场景,做BI的时候非常有用,数据压缩比极高,一般做法是做2个instance前端用Netscaler(NSC)之类作Load Balance,需要维护的时候直接把其中一个OOS即可。

既然提到BI,肯定会用到大名鼎鼎的MicroStrategy(微策略)把Infobright的数据做进一步的加工,这个在很多公司都是很通用的做法。不得不说MicroStrategy做的真是很差劲,建模得到的mmp文件只能通过它自带的GUI工具Import,不过幸好有个Command manager来自动化,否则一个个导入会让人疯掉的。
阅读(1071) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~