Chinaunix首页 | 论坛 | 博客
  • 博客访问: 435155
  • 博文数量: 54
  • 博客积分: 610
  • 博客等级: 上士
  • 技术积分: 721
  • 用 户 组: 普通用户
  • 注册时间: 2011-01-24 10:52
文章分类

全部博文(54)

文章存档

2013年(27)

2012年(11)

2011年(16)

分类: HADOOP

2013-08-05 23:13:48

Map/Reduce:分布式数据处理模型和执行环境
HDFS: 分布式文件系统 Hadoop Distributed File System
Pig : 一种数据流语言和运行环境,用来检索非常大的数据集,Pig运行在Map/Reduce 和HDFS的集群上
HBase :是一个分布式的、面向列的开源数据库
Hive :是基于Hadoop的一个工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合的统计分析。
阅读(1681) | 评论(0) | 转发(1) |
0

上一篇:初识Hadoop

下一篇:HDFS 分布式文件系统

给主人留下些什么吧!~~