按类别查询搜索结果
关于关键词 的检测结果,共 194
joepayne | 2014-02-25 19:01:45 | 阅读(0) | 评论(0)
scq2099yt | 2014-02-23 17:42:12 | 阅读(9390) | 评论(1)
        这里的开发环境是指:Hadoop集群安装在Linux下,本地开发环境在Windows下用Hadoop-eclipse-plugin,远程连接Linux运行job。一、安装        Hadoop集群安装配置请参看这里,Java与Eclipse的安装配置请参看这里,下面介绍Hadoop-eclipse-p...【阅读全文】
buaaedifier | 2014-01-26 22:55:18 | 阅读(2600) | 评论(0)
linux平台下有个ls指令,大家都很熟悉:① ls | grep 2008   查询文件名包含2008的文件(这其实就是一个map,找到需要的数据)② ls | grep 2008 | wc -l 计算上述指令查询文件个数(这其实就是一个reduce,对找到数据进行汇总聚合) 再来一个例子,关于SQL:select * from device&nb...【阅读全文】
LaoLiulaoliu | 2014-01-09 10:33:40 | 阅读(680) | 评论(0)
文章来源:http://blog.csdn.net/pelick/article/details/76194931.  背景介绍       谈到分布式系统,就不得不提到Google的三驾马车:GFS[1],MapReduce[2]和BigTable[3]。虽然Google没有开源这三个技术的实现源码,但是基于这三篇开源文档, Nutch项目子项目之一的Yahoo资助的Had...【阅读全文】
LaoLiulaoliu | 2014-01-07 00:49:35 | 阅读(2220) | 评论(4)
我的机器是mac book,安装virtualbox4.3.6,virtualbox安装ubunt13.10,在多点分布环境中,配置好一个机器后,clone出另外2个,一共三台机器。1. Configure the Environmentsudo apt-get install -y openjdk-7-jdk openssh-serversudo addgroup hadoopsudo adduser —ingroup hadoop hadoop # create passwordsu - had...【阅读全文】
LaoLiulaoliu | 2014-01-05 23:13:10 | 阅读(1130) | 评论(0)
周海汉 /文2012.9.13本文地址:http://abloz.com/2012/09/13/the-hadoop-system-of-port.htmlhadoop系统部署时用到不少端口。有的是Web UI所使用的,有的是内部通信所使用的,有的是监控所使用的。实际系统中可能用于防火墙的端口设计。一些内部通信用的端口可能也需要外部能访问。如两个集群的数据对拷。1....【阅读全文】
Larpenteur | 2013-12-19 12:15:11 | 阅读(1770) | 评论(0)
     腾出手来对部署好的hadoop/hbase云计算平台进行取证分析测试,但是运行过程中经常会不时地node2无法正常启动HRegionserver,从而导致整个平台的计算受到影响。之前自己围绕HMaster自动关闭的问题,删除了各个节点的HDFS目录,重新格式化后问题得到了解决,但是这次问题却依旧,于是自己只好去日志中一...【阅读全文】
圣剑蓝骑士 | 2013-12-19 06:58:29 | 阅读(940) | 评论(0)
最近看到清华大学出版社发行的一本新书,《深入浅出云计算》出版时间是2012-10-01日,如图1所示。我以为这是一本科普型读物,是加深读者对云计算的认识的书籍,毕竟云计算覆盖的领域太广了。泛读后发现完全不是这么回事。全书基本上都是在讲Hadoop以及Hadoop生态圈里面的相关工具和技术。如图2所示:我由此联想到前...【阅读全文】
jiongtoast | 2013-12-06 11:04:12 | 阅读(1170) | 评论(0)
1、自己写MapReduce任务,虽然开发难度大一点,但运行效率比Pig和Hive高,像Google的PageRank排名,机器学习、推荐,全盘扫描的ETL都是这种方式的典型应用;2、用Hive做分析,Hive的一大好处就是能使用程序员熟悉的SQL进行计算任务编写,但某些运算效率不及M/R;3、用Pig做数据分析,Pig是Yahoo的研发成果,yahoo也希望...【阅读全文】
niao5929 | 2013-12-06 10:38:30 | 阅读(580) | 评论(0)
     腾出手来对部署好的hadoop/hbase云计算平台进行取证分析测试,但是运行过程中经常会不时地node2无法正常启动HRegionserver,从而导致整个平台的计算受到影响。之前自己围绕HMaster自动关闭的问题,删除了各个节点的HDFS目录,重新格式化后问题得到了解决,但是这次问题却依旧,于是自己只好去日志中一...【阅读全文】
windhawkgyang | 2013-12-05 16:13:23 | 阅读(1650) | 评论(1)
     腾出手来对部署好的hadoop/hbase云计算平台进行取证分析测试,但是运行过程中经常会不时地node2无法正常启动HRegionserver,从而导致整个平台的计算受到影响。之前自己围绕HMaster自动关闭的问题,删除了各个节点的HDFS目录,重新格式化后问题得到了解决,但是这次问题却依旧,于是自己只好去日志中一...【阅读全文】
zzjlzx | 2013-11-29 11:28:30 | 阅读(1590) | 评论(0)
在多硬盘情况下的Hadoop配置注意项分类: hadoop 收藏2012-04-23 20:04 280人阅读 评论(0) 收藏 举报hadoophtml多线程文档测试原文地址:http://blog.csdn.net/dajuezhao/article/details/6797015一、背景1、最近在做hadoop的性能测试,采用了自带的Ter...【阅读全文】
jiongtoast | 2013-10-29 16:45:38 | 阅读(950) | 评论(0)
hive使用的一些小技巧,包括udf、笛卡尔积、join的规则和排序。【阅读全文】
【HADOOP】 Hive安装配置
jiongtoast | 2013-10-25 13:16:49 | 阅读(610) | 评论(0)
hive的安装配置【阅读全文】
double_lq | 2013-10-17 10:05:45 | 阅读(1790) | 评论(0)
这可以算做是一个java笔试题回答这个问题,首先要回答第二问。一个.java文件当然可以包括多个类了。但这些类有一个特殊的类与其它的不同,,这个类是带public 属性的类。一个.java类文件中仅有一个public属性的类。而       且这个类与文件名相同。一个.java文件是否一定要有一个public&...【阅读全文】
double_lq | 2013-10-16 20:36:17 | 阅读(3230) | 评论(0)
背景:下载了JDK1.7,其中包含对应的源代码src.zip假设我要查看public Document parse(InputStream is){}函数的源代码。该函数在JDK的rt.jar的包javax.xml.parsers下的DocumentBuilder.java中。怎样将该源文件与eclipse关联呢?一、将源码导入到eclipse中方法1、选择 rt.jar,右击选择properties;建立源代码目录&...【阅读全文】
jieforest | 2013-10-16 10:10:56 | 阅读(2780) | 评论(0)
有人问我,“你在大数据和Hadoop方面有多少经验?”我告诉他们,我一直在使用Hadoop,但是我处理的数据集很少有大于几个TB的。他们又问我,“你能使用Hadoop做简单的分组和统计吗?”我说当然可以,我只是告诉他们我需要看一些文件格式的例子。他们递给我一个包含600MB数据的闪盘,看起来这些数据并非样本数据,由于一...【阅读全文】
jieforest | 2013-10-12 10:01:09 | 阅读(2820) | 评论(0)
最近看到清华大学出版社发行的一本新书,《深入浅出云计算》出版时间是2012-10-01日,如图1所示。我以为这是一本科普型读物,是加深读者对云计算的认识的书籍,毕竟云计算覆盖的领域太广了。泛读后发现完全不是这么回事。全书基本上都是在讲Hadoop以及Hadoop生态圈里面的相关工具和技术。如图2所示:我由此联想到前...【阅读全文】
coolcole | 2013-10-03 20:55:04 | 阅读(1040) | 评论(0)
From:http://www.programmer.com.cn/10416/    2011年,对Hadoop来说注定是载入史册的一年:Yahoo!与风险投资公司Benchmark Capital联合建立独立公司Hortonworks,接手Yahoo!开源软件平台Apache Hadoop;Hadoop海量数据分析平台Datameer、Karmasphere和Hadapt分别获得千万美元级别投资;一向对开源趋势不屑一顾的微软转投Hadoop怀抱;Hadoop之父Doug Cutting第一次莅临中国,布道Hadoop 0.23…… 可以说,Hadoop生态系统呈【阅读全文】
windhawkgyang | 2013-09-16 14:26:09 | 阅读(2760) | 评论(0)
     今天需要单独配置一台新的Ubuntu服务器作为Hadoop集群的Master,一直使用动态IP,这回还特意去查了资料,很简单,记下来留作资料供以后忘记了查找吧。     Ubuntu的网络配置总的来说需要两步:配置接口属性、配置DNS,这里我们直接使用修改配置文件永久生效的方式来进行。一、配置接...【阅读全文】