Hadoop 内存溢出 swap 用完 - 问题描述,以及注意-liukaiyi-ChinaUnix博客

Chinaunix首页 | 论坛 | 博客

liukaiyiskynet.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

博客访问： 668054
博文数量： 149
博客积分： 3901
博客等级：中校
技术积分： 1558
用户组：普通用户
注册时间： 2009-02-16 14:33

文章分类

全部博文（149）

数据挖掘组（5）
linux（2）
基础知识（2）
读书（8）

mbalib:营销分析（1）

《引爆流行》（1）

《长尾理论》（1）

《云计算》（4）
工具服务器（15）

wiki - trac（1）

版本控制器（5）

消息队列（0）

gearman（3）

同步/备份（2）

调度系统（2）

nginx（1）
编辑器（9）

vim（9）
产品的智慧（9）

提纲（0）
数据分析（11）

load（0）

cleansing（2）

transform（0）

extract（0）

算法（1）

数据结构（0）
语言（28）

shell（1）

R（5）

english（0）

c（0）

javascript（0）

perl（7）

python（9）
数据存储（57）

postgres（7）

hadoop（29）

voldemort（2）

cassandra（1）

infobright（2）

mysql（9）

mongodb（3）
未分配的博文（3）

文章存档

2014年（2）

2013年（10）

2012年（32）

2011年（21）

2010年（84）

我的朋友

最近访客

推荐博文

相关博文

Hadoop 内存溢出 swap 用完 - 问题描述,以及注意

分类：服务器与存储

2011-05-16 19:34:30

在写 hadoop mapreduce 时内存需要比较注意的地方：

我们的配置 mapred-site.xml

mapred.tasktracker.map.tasks.maximum = 6 jvm

mapred.tasktracker.reduce.tasks.maximum = 2 jvm

mapred.child.java.opts = -Xmx2048m -Xms512m

最差情况 8 * 2G = 16G

在 map 两个关键的配置 :

Io.sort.mb / io.sort.spill.percent ，map jvm 一上来这两个配置就决定初始大小。

在 StatBase （10.10.70.85凌晨5点的一个mapreduce 上）

我的 Io.sort.mb / io.sort.spill.percent = 1000 / 0.8 也就是每台机器初始： 6*800M

跑一段时间后内存小的就开始大量使用 swap ，

reduce 上来有大概在 1.2~1.3G * 8 的内存使用量 swap 4G全部用完

总结：尽量配置 io.sort.mb 小于 200m ，这样每个jvm 大概在在最后 500m 之间.

每台机器 500m*8 应该没问题

阅读(3790) | 评论(0) | 转发(0) |

0

上一篇：hadoop 集群杀僵尸进程

下一篇：hadoop 多属性排重

给主人留下些什么吧！~~

关于我们 | 关于IT168 | 联系方式 | 广告合作 | 法律声明 | 免费注册

Copyright 2001-2010 ChinaUnix.net All Rights Reserved 北京皓辰网域网络信息技术有限公司. 版权所有

感谢所有关心和支持过ChinaUnix的朋友们