Chinaunix首页 | 论坛 | 博客
  • 博客访问: 6818
  • 博文数量: 4
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 60
  • 用 户 组: 普通用户
  • 注册时间: 2013-03-25 09:00
文章分类

全部博文(4)

文章存档

2013年(4)

我的朋友

分类: 大数据

2013-03-25 14:33:40

 

大数据时代的历史机遇——产业变革与数据科学

第二节  大数据的定义和特征

提要:

1.未来的不确定性是人类产生恐惧的根源之一,也是各类组织最为头痛的问题。大数据技术让我们看到解决未来预测问题的一丝曙光。

2.大数据四个典型的特征:第一,数据量巨大;第二,数据类型多样;第三,数据中富含价值;第四,必须在尽可能短的时间内发掘出价值。

3.尽管本节重点介绍大数据的四个特征,但是并非只有数据量大,才能称为大数据。我们更看重的是“快速的从各类数据中获得信息的能力”。


麦肯锡(美国首屈一指的咨询公司)是研究大数据的先驱。在其报告《
Big data: The next frontier for innovation, competition,and productivity》中给出的大数据定义是:大数据指的是大小超出常规的数据库工具获取、存储、管理和分析能力的数据集。但它同时强调,并不是说一定要超过特定TB值的数据集才能算是大数据

国际数据公司(IDC)从大数据的四个特征来定义,即海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、多样的数据类型(Variety)、巨大的数据价值(Value)。

亚马逊(全球最大的电子商务公司)的大数据科学家John Rauser给出了一个简单的定义:大数据是任何超过了一台计算机处理能力的数据量。

维基百科中只有短短的一句话:“巨量资料(big data),或称大数据,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的资讯”

大数据是一个宽泛的概念,见仁见智。上面几个定义,无一例外地都突出了“大”字。诚然“大”是大数据的一个重要特征,但远远不是全部。笔者在调研多个行业后,给出了自己的定义:大数据是“在多样的或者大量数据中,迅速获取信息的能力前面几个定义都是从大数据本身出发,我们的定义更关心大数据的功用。它能帮助大家干什么?在这个定义中,重心是“能力”。大数据的核心能力,是发现规律和预测未来。

大数据第一章第二节.doc

阅读(482) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~