分类: 其他平台
2015-12-28 20:15:21
IBM BigSheets 是 IBM 在商业分析领域的一项最新技术,可以对非结构化或者半结构化的海量数据进行快速分析,这项技术已经应用于大英图书馆中。BigSheets 提供了一个基于 web 的界面来轻松加载、分析和导出数据,目前已经集成在 BigInsights Enterprise 版本中(BigInsights 是一个基于 Apache Hadoop 的数据分析处理平台,在《实战 IBM BigInsights,轻松实现 Hadoop 的部署与管理》一文中有详细的介绍)。
BigSheets 主要提供了以下功能特性:
BigSheets 用数据集合(Collection)来代表一个数据集(可以是原始数据或者分析数据),它是用户操作的主要对象。数据集合的形式类似于 Excel 中的数据表,行代表数据集中的值,列代表数据集的各个属性。BigSheets 利用阅读器来对导入的文件进行解析与显示,支持 7 种默认的阅读器以及用户自定义阅读器。