infobright是mysql的一个存储引擎,但跟传统的不同,它是以列
假如一个tab结构大致如下:
id name score
1 fu 100
2 huang 100
那么传统的数据库存储方式会是
1 fu 100 , 2 huang 100
列存储将是
1 2,fu huang, 100 100
在myisam/innodb都是第一种,
比如我要做data mining的时候,求sum(score)那么肯定是列的最快了,因为他们的在磁盘上存储区域很近。
而且infobright很多方便的地方,数据迁移可以stop service然后拷贝数据,start service.
压缩比非常之高,所以做BI分析是比较好的选择。缺点不支持mysqldump等。
只能select out 部分DDL/DML不支持。
适用场景,做BI的时候非常有用,数据压缩比极高,一般做法是做2个instance前端用Netscaler(NSC)之类作Load Balance,需要维护的时候直接把其中一个OOS即可。
既然提到BI,肯定会用到大名鼎鼎的MicroStrategy(微策略)把Infobright的数据做进一步的加工,这个在很多公司都是很通用的做法。不得不说MicroStrategy做的真是很差劲,建模得到的mmp文件只能通过它自带的GUI工具Import,不过幸好有个Command manager来自动化,否则一个个导入会让人疯掉的。
阅读(1114) | 评论(0) | 转发(0) |