全部博文(247)
发布时间:2013-07-31 11:59:05
根据Hadoop++论文的描述,Hadoop执行过程分为Load、Map、Shuffle、Reduce这四个阶段,可以看成是一个由split、 itemize、map、reduce等10个函数或算子组成的DAG。其中每一个函数或算子,都可以提供自定义的实现以此来扩展Hadoop的功能或优 化性能。1、Load阶段输入数据经block函数,按配置的block大小切分成多个bloc.........【阅读全文】
发布时间:2013-07-31 11:50:28
这里我用了一个名字叫做exe4j的免费小软件,感觉不错。下面我将我把java的.class文件生成可执行文件的流程讲一下。 首先:将你要选择好你即将发布的.class文件就不用细说了,下面是创建jar文件,这里我用一个名字叫做test.class的文件来举例,另外注意还要编写一个确定main_class的文件manifest.mf,在这里mainfes.........【阅读全文】
发布时间:2013-07-31 11:35:30
调研总结 by yingru 先记录server端的机制 最初接触RPC,用自己的思路来猜测RPC的实现机制: Server端开启socket监听,listen()à accept()àread()àwrite()àclose() 有请求来时开启thread处理请求,原进程继续监听,请求完毕后将结果返回给client端 这样设计.........【阅读全文】
发布时间:2013-07-31 11:34:15
转自http://www.cnblogs.com/sidmeng/archive/2012/04/09/2438592.html目前,hadoop社区有几个不同的分支版本,各个版本之前又相互联系。以下是几个主要版本的一些介绍。 0.20.2是一个stable的版本,他又几个子版本,0.20.203 具有security特性,但是不具有append和raid功能。 0.20-append具有a.........【阅读全文】
发布时间:2013-07-31 11:33:52
刚看到Hadoop序列化这一概念时,想不通为什么要序列化。因为之前一直用C, C语言中,网络两端通信或者读写文件,完全没关注过序列化这个概念。我想可能是因为C中每次使用的变量都有明确的类型定义,不需要这样明确地把序列化的概念提出来,C库中将这一过程实现了(这是我的猜想 因为看到有些C程序 使用int型变量并不是直.........【阅读全文】