效字当先,以质为本。测试开发入行十余年,辉煌过,迷茫过,持续探寻人生的激情和前进的步伐!好好生活,认真工作!
发布时间:2014-06-16 21:52:42
上一篇也简单提到了Hadoop中的MapReduce(下面都简写为MR)是一种分布式计算模型,起初由Google提出,主要用于搜索领域,解决海量数据的计算问题。MR由两个阶段组成:Map和Reduce,用户只需要实现Map()和Reduce()两个函数,即可实现分布式计算,这两个函数的形参是key、value对,表示函数的输入信息.........【阅读全文】
发布时间:2014-06-09 00:41:18
1、基础了解 先说说Hadoop是个什么玩意儿,一个分布式系统基础架构,由apache基金会所研发,用户可以利用集群的威力高速运算和存储数据; Hadoop实现了一个分布式文件系统(Hadoop Distributed Flie Syste.........【阅读全文】
发布时间:2014-05-10 21:49:19
当管理数以十计或者更多的系统时,常常需要在多台机器上执行相同的命令。pdsh即可实现。首先必须在管理节点和每台目标机器上都安装pdsh软件包。pdsh可以在指定的一组机器上执行同一个命令。例如需要管理下列机器,机器名分别为srv1,srv2,srv3,srv4,srv5。命令格式如下:pdsh -w [SSH_OR_RSH]:USERNAME@srv[1,2-4,5] [COM.........【阅读全文】
发布时间:2014-04-15 10:22:03
[root@master conf]# vim /etc/hadoop/conf/core-site.xml<property> <name>fs.trash.interval</name> <value>1440</value> <description>save one day(1440 min---60*24)</description> </property>注释:value值为保存时间,默认是0,单位.........【阅读全文】