Hadoop的Slots概念-squall_sw-ChinaUnix博客

老海贼kasim.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

squall_sw

博客访问： 322434
博文数量： 65
博客积分： 2570
博客等级：少校
技术积分： 730
用户组：普通用户
注册时间： 2008-08-15 14:04

个人简介

苦逼房奴一枚

文章分类

全部博文（65）

TypeSdk部署（2）
TypeSDK接入实现（6）
TypeSDK运营功能（2）
TypeSDK服务端设（6）
TypeSDK客户端设（6）
手游聚合SDK（2）
hadoop（4）
Android（2）
windows（6）
linux（17）
ESX（4）
netbackup（1）
.net（7）
未分配的博文（0）

文章存档

2017年（19）

2016年（5）

2013年（6）

2012年（1）

2011年（3）

2009年（5）

2008年（26）

我的朋友

tristan

相关博文

Hadoop的Slots概念

分类：大数据

2013-08-28 10:47:56

Slots是Hadoop的一个重要概念。然而在Hadoop相关论文，slots的阐述难以理解。网上关于slots的概念介绍也很少，而对于一个有经验的Hadoop开发者来说，他们可能脑子里已经理解了slots的真正含义，但却难以清楚地表达出来，Hadoop初学者听了还是云里雾里。我来尝试讲解一下，以期抛砖引玉。

首先，slot不是CPU的Core，也不是memory chip，它是一个逻辑概念，一个节点的slot的数量用来表示某个节点的资源的容量或者说是能力的大小，因而slot是 Hadoop的资源单位。

Hadoop利用slots来管理分配节点的资源。每个Job申请资源以slots为单位，每个节点会确定自己的计算能力以及memory确定自己包含的slots总量。当某个Job要开始执行时，先向JobTracker申请slots，JobTracker分配空闲的slots，Job再占用slots，Job结束后，归还slots。
每个TaskTracker定期（例如淘宝Hadoop心跳周期是5s）通过心跳(hearbeat)与Jobtracker通信，一方面汇报自己当前工作状态，JobTracker得够某个TaskTracker是否Alive；同时汇报自身空闲slots数量。JobTracker利用某个调度规则，如Hadoop默认调度器FIFO或者Capacity Scheduler、FairScheduler等。（注：淘宝Hadoop使用云梯调度器YuntiScheuler，它是基于Fair Scheduler进行修改的，具体针对哪些点进行了修改，下次再介绍）。
Hadoop里有两种slots, map slots和reduce slots，map task使用map slots，一一对应，reduce task使用reduce slots。注：现在越来越多的观点认为应该打破map slots与 reduce slots的界限，应该被视为统一的资源池，they are all resource，从而提高资源的利用率。区分map slots和reduce slots，容易导致某一种资源紧张，而另一个资源却有空闲。在Hadoop的下一代框架MapR中，已经取消了map slots与reduce slots的概念，并将Jobtracker的功能一分为二，用ResourceManager来管理节点资源，用ApplicationMaster来监控与调度作业。ApplicationMaster是每个Application都有一个单独的实例，application是用户提交的一组任务，它可以是一个或多个job的任务组成。

Hadoop中通常每个tasktracker会包含多个slots，Job的一个task均对应于tasktracker中的一个slot。系统中map slots总数与reducer slots总数的计算公式如下：
- Map slots总数=集群节点数×mapred.tasktracker.map.tasks.maximum
- Reducer slots总数=集群节点数×mapred.tasktracker.reduce.tasks.maximum

最后，如何确定一个集群map slots以及reduce slots？
- 请参考 hadoop mapreduce tutorial

http://hadoop.apache.org/common/docs/current/mapred_tutorial.html

阅读(5398) | 评论(0) | 转发(0) |

上一篇：hadoop的jmx监控（方便简单）

下一篇：Hadoopref to mysql for python

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6