hadoop配置参数说明-Larpenteur-ChinaUnix博客

尘世中一个迷途小书童riverhwp.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

Larpenteur

博客访问： 6462068
博文数量： 2759
博客积分： 1021
博客等级：中士
技术积分： 4091
用户组：普通用户
注册时间： 2012-03-11 14:14

文章分类

全部博文（2759）

Todo（1）
Advice（151）
Linux-未分类（223）
Ubuntu（47）
Database（145）
算法&DS（77）
Android（47）
Web（214）
Geek（237）
CPPC（296）
Java（113）
Python（99）
Matlab（19）
Git（19）
SVN（11）
Gnuplot（5）
面试（0）
机器-挖掘-AI（6）
开源项目（1）
Happy Drawe（9）
Programming（144）

Tools（23）

Shell（66）

Makefile（11）

GDB（26）

vim（18）
System（628）

Author（110）

Common（4）

Memory（66）

File system（82）

Driver（19）

IO（66）

Storage（45）

General（38）

Architecture（19）

Command（64）

Kernel（115）
Virtualization（39）
Cloud（33）
Hadoop（71）
Big Data（24）
未分配的博文（100）

文章存档

2019年（1）

2017年（84）

2016年（196）

2015年（204）

2014年（636）

2013年（1176）

2012年（463）

我的朋友

相关博文

hadoop配置参数说明

分类：云计算

2013-10-24 11:48:10

原文地址：hadoop配置参数说明作者：1012191556

在这里写一遍hadoop的参数说明，自己多记忆一下，如果有人需要也可以帮助一下大家
Hadoop配置文件分为两类：1、只读类型的默认文件：src/core/core-default.xml     src/hdfs/hdfs-default.xml    src/mapred/mapred-default.xml   conf/mapred-queues.xml
2. 定位（site-specific）设置：conf/core-site.xml   conf/hdfs-site.xml conf/mapred-site.xml conf/mapred-queues.xml
还有设置conf/hadoop-env.sh来为hadoop的守护进程设置环境变量。一般对于守护进程设置环境变量至少需要设置java_home的环境变量，也可以对不同的守护进程分别进行设置：
守护进程   NameNode          配置选项为           HADOOP_NameNode_OPTS
               DataNode                                      HADOOP_DataNode_OPTS
               SecondaryNameNode                    HADOOP_SECONDARYNameNode_OPTS
               JobTracker                                     HADOOP_JOBTRACKER_OPTS
               TaskTracker                                    HADOOP_TASKTRACKER_OPTS
一些文件的配置参数说明如下：
conf/core-site.xml文件： fs.default.name    NameNode的IP地址及端口的设置
conf/hdfs-site.xml文件： dfs.name.dir      NameNode存储名字空间及汇报日志的位置
                                      dfs.data.dir        DataNode 存储数据块的位置
conf/mapred-site.xml文件：     mapreduce.jobtracker.address        JobTracker的IP地址及端口
                                              mapreduce.jobtracker.system.dir    Mapreduce在HDFS上存储文件的位置，例如/Hadoop/mapred/sysem/
                                              mapreduce.cluster.local.dir             Mapreduce的缓存数据存储在文件系统上的位置
                                              mapred.tasktracker.{map|reduce}.tasks.maximum      每台Taskracker所能运行的Map或Reduce的task的最大数量
                                              dfs.hosts/dfs.hosts.exclude                  允许或禁止的DataNode列表

其实配置并不复杂，一般而言，除了规定端口、IP地址、文件的存储位置外，其他配置都不是必须修改的，可以根据需要采取默认还是自己修改。
注意的是，配置文件一旦修改就默认为是最终参数，这些参数都不可以在程序中再次修改。

阅读(732) | 评论(0) | 转发(0) |

上一篇：html5中让页面缩放的4种方法

下一篇：可遍历空间和不可遍历空间的算法思想对比总结（不断补充）

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6