Map/Reduce:分布式数据处理模型和执行环境
HDFS: 分布式文件系统 Hadoop Distributed File System
Pig : 一种数据流语言和运行环境,用来检索非常大的数据集,Pig运行在Map/Reduce 和HDFS的集群上
HBase :是一个分布式的、面向列的开源数据库
Hive :是基于Hadoop的一个工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合的统计分析。
阅读(1681) | 评论(0) | 转发(1) |