Chinaunix首页 | 论坛 | 博客
  • 博客访问: 905006
  • 博文数量: 73
  • 博客积分: 2689
  • 博客等级: 少校
  • 技术积分: 897
  • 用 户 组: 普通用户
  • 注册时间: 2010-10-07 19:39
个人简介

一个有目标,为自己的未来努力奋斗的人

文章分类
文章存档

2015年(9)

2014年(2)

2013年(6)

2012年(11)

2011年(33)

2010年(12)

发布时间:2015-02-04 17:35:31

基本的读取配置文件
-read(filename) 直接读取ini文件内容
-sections() 得到所有的section,并以列表的形式返回
-options(section) 得到该section的所有option
-items(section) 得到该section的所有键值对
-get(section,option) 得到section中option的值,返回为string类型
-getint(section,option) 得到section中option的值,返回为int类型,还有相应的getboolean()和getfloat() 函数。......【阅读全文】

阅读(63815) | 评论(0) | 转发(1)

发布时间:2015-02-03 15:46:37

容错性
  使用Hadoop来运行你的作业的其中一个主要原因就是它的高容错性,就算在由高失败率的节点或网络组成的大集群内运行的作业,Hadoop都可以让作业成功完成。
  Hadoop实现容错的主要方法就是重新执行任务,单个任务节点(TaskTracker)会不断的与系统的核心节点(JobTracker)进行通信,如果一个TaskTracker在一定时间内(默认是1分钟)无法与JobTracker进行通信,那JobTracker会假设这个TaskTracker出问题挂了,JobTracker了解给每个TaskTracker赋予了那些map和reduce任务。......【阅读全文】

阅读(1127) | 评论(0) | 转发(0)

发布时间:2015-02-03 15:45:27

输入块(InputSplit):一个输入块描述了构成MapReduce程序中单个map任务的一个单元。把一个MapReduce程序应用到一个数据集上,即是指一个作业,会由几个(也可能几百个)任务组成。Map任务可能会读取整个文件,但一般是读取文件的一部分。默认情况下,FileInputFormat及其子类会以64MB(与HDFS的Block默认大小相同,译注:Hadoop建议Split大小与此相同)为基数来拆分文件。......【阅读全文】

阅读(927) | 评论(0) | 转发(0)

发布时间:2015-02-03 15:43:13

MapReduce的输入一般来自HDFS中的文件,这些文件分布存储在集群内的节点上。运行一个MapReduce程序会在集群的许多节点甚至所有节点上运行mapping任务,每一个mapping任务都是平等的:mappers没有特定“标识物”与其关联。因此,任意的mapper都可以处理任意的输入文件。每一个mapper会加载一些存储在运行节点本地的文件集来进行处理......【阅读全文】

阅读(763) | 评论(0) | 转发(0)
给主人留下些什么吧!~~

2011-12-15 18:52

CUKdd: 我要人气,多来我这里看看哈  哈哈.....
好的,你多写点好东西,我以后多去看看~~

回复  |  举报

2011-12-15 16:43

CUKdd: 没人气啊   加油!.....
要人气干嘛,写给自己看的,以后查的时候方便。

回复  |  举报
留言热议
请登录后留言。

登录 注册