Apache Hadoop周边名词-blue_1110-ChinaUnix博客

我了个去羽guoyulin.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

blue_1110

博客访问： 439481
博文数量： 54
博客积分： 610
博客等级：上士
技术积分： 721
用户组：普通用户
注册时间： 2011-01-24 10:52

文章分类

全部博文（54）

Big Data（4）
小知识（1）
设计模式（2）
Tools（0）
Android（1）
VBA（1）
法语相关（4）
网络（1）
算法（1）
Ubuntu/Vmware 7（7）
J2EE（13）
ORACLE（2）
J2SE（11）
C/C++/QT（6）
未分配的博文（0）

文章存档

2013年（27）

2012年（11）

2011年（16）

我的朋友

相关博文

Apache Hadoop周边名词

分类： HADOOP

2013-08-05 23:13:48

Map/Reduce:分布式数据处理模型和执行环境
HDFS: 分布式文件系统 Hadoop Distributed File System
Pig : 一种数据流语言和运行环境，用来检索非常大的数据集，Pig运行在Map/Reduce 和HDFS的集群上
HBase :是一个分布式的、面向列的开源数据库
Hive :是基于Hadoop的一个工具，可以将结构化的数据文件映射为一张数据库表，并提供完整的sql查询功能，可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合的统计分析。

阅读(1702) | 评论(0) | 转发(1) |

上一篇：初识Hadoop

下一篇：HDFS 分布式文件系统

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6