Chinaunix首页 | 论坛 | 博客
  • 博客访问: 163813
  • 博文数量: 118
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 12
  • 用 户 组: 普通用户
  • 注册时间: 2013-06-21 16:38
文章分类

全部博文(118)

文章存档

2013年(118)

我的朋友

分类: HADOOP

2013-08-08 10:06:44

原文地址:Apache Hadoop周边名词 作者:blue_1110

Map/Reduce:分布式数据处理模型和执行环境
HDFS: 分布式文件系统 Hadoop Distributed File System
Pig : 一种数据流语言和运行环境,用来检索非常大的数据集,Pig运行在Map/Reduce 和HDFS的集群上
HBase :是一个分布式的、面向列的开源数据库
Hive :是基于Hadoop的一个工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合的统计分析。
阅读(381) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~