分类: Java
2015-03-26 13:33:12
Pig 是在MapReduce上构建的查询语言(SQL-like),适用于大量并行计算。
Chukwa 是基于Hadoop集群中监控系统,简单来说就是一个“看门狗” (WatchDog)
Hive 是DataWareHouse 和 Map Reduce交集,适用于ETL方面的工作。
HBase 是一个面向列的分布式数据库。
Map Reduce 是Google提出的一种算法,用于超大型数据集的并行运算。
HDFS 可以支持千万级的大型分布式文件系统。
Zookeeper 提供的功能包括:配置维护、名字服务、分布式同步、组服务等,用于分布式系统的可靠协调系统。
Avro 是一个数据序列化系统,设计用于支持大批量数据交换的应用。
----------------------------------------------------------------------------创建表 | create '表名称', '列名称1','列名称2','列名称N' | |
添加记录 | put '表名称', '行名称', '列名称:', '值' | |
查看记录 | get '表名称', '行名称' | |
查看表中的记录总数 | count '表名称' | |
删除记录 | delete '表名' ,'行名称' , '列名称' | |
删除一张表 | 先要屏蔽该表,才能对该表进行删除,第一步 disable '表名称' 第二步 drop '表名称' | |
查看所有记录 | scan "表名称" | |
查看某个表某个列中所有数据 | scan "表名称" , ['列名称:'] | |
更新记录 | 就是重写一遍进行覆盖 |