hadoop 1.2.1 Eclipse mapreduce hello word 学习笔记(二)-zzjlzx-ChinaUnix博客

zzjlzxzzjlzx.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

zzjlzx

博客访问： 10530341
博文数量： 1669
博客积分： 16831
博客等级：上将
技术积分： 12594
用户组：普通用户
注册时间： 2011-02-25 07:23

个人简介

柔中带刚，刚中带柔，淫荡中富含柔和，刚猛中荡漾风骚，无坚不摧，无孔不入！

文章分类

全部博文（1669）

NGINX（1）
MongoDB（2）
docker（8）
shadowsocks（1）
CloudFoundry（11）
CloudStack（102）
openstack（61）
PHP（0）
mail（0）
hadoop（25）
GemFire（1）
文件系统（4）
CDN（7）
下载及资源（15）
数据缓存（8）
web 加速（9）
分布式文件系统架（23）
虚拟化（133）
同步（6）
网站架构（50）
windows 监控（15）
mysql 监控（5）
oracle 监控（2）
linux 监控（24）
web 监控（35）
其他数据库（27）
备份恢复（28）
VPN及认证（24）
云系统（29）
windows（29）
WEB 故障（13）
mysql 备份（10）
oracle 集群（15）
HA及负载均衡（52）
存储（66）
shell（39）
web 应用（19）
mysql 优化（16）
mysql 故障（14）
mysql 安全（8）
mysql 配置（29）
mysql 应用（10）
web 安全（21）
SAN交换路由（26）
web 优化（46）
基础解释（24）
linux 安全（37）
linux 故障（22）
linux 应用（85）
linux 配置（64）
web 配置（23）
oracle 备份（33）
UNIX（12）
Solaris（5）
Aix（1）
oracle 配置（69）
oracle 优化（62）
oracle 安全（10）
oracle 应用（30）
交流（29）
oracle 故障（59）
linux 优化（31）
未分配的博文（4）

文章存档

2023年（4）

2022年（1）

2021年（10）

2020年（24）

2019年（4）

2018年（19）

2017年（66）

2016年（60）

2015年（49）

2014年（201）

2013年（221）

2012年（638）

2011年（372）

我的朋友

hadoop 1.2.1 Eclipse mapreduce hello word 学习笔记(二)

分类： hadoop2013-10-23 19:48 62人阅读评论(0) 收藏举报

上一篇文章在http://blog.csdn.net/zwkwd/article/details/11740589

在 hadoop 1.2.1成功配置了为分布式环境,经过了十一长假,该继续学习了,

这次要在eclipse下运行一个hadoop 应用

开发环境

操作系统:CentOS Linux release 6.0 (Final)

eclipse4.3

java version "1.7.0_25"

第一步运行 start-all.sh 可以参照上一篇文章,启动守护线程

发现启动有问题,原来是ip地址冲突了而我的xml配置中设置的ip地址没有生效,没办法改一下ip

DEVICE="eth0"
BOOTPROTO=static
IPADDR=192.168.2.88
此处改成没有被占用的ip

/etc/rc.d/init.d/network restart 使修改生效

生效后修改vim core-site.xml
vim mapred-site.xml 设置的ip (如果设置成 localhost 就不用改了)

配置eclipse插件

获取插件

参考: 可以自己生成也可以直接下载使用

安装完重新打开eclipse后

在showview里面可以考到选项如果

选择让其显示在控制台旁边

右键新建一个

如图

master 处填写 mapred-site.xml ip和端口 dfs master 处填写 core-site.xml ip和端口

设置hadoop的安装路径如图

设置完后可以看到资源目录下如图

我们可以在这里通过右键对dfs文件进行操作 (增删上传下载)

创建helloword工程

File -> New -> Project 选择“Map/Reduce Project”，然后输入项目名称，创建项目。插件会自动把hadoop根目录和lib目录下的所有jar包导入

如图

第一个例子准备运行文档中的实例

打开

点击如图

按照例子建立package 和 class 将代码复制

[java]view plaincopy
					
				package org.myorg;     
			
				import java.io.IOException;   
			
				import java.util.*;   
			
				import org.apache.hadoop.fs.Path;   
			
				import org.apache.hadoop.conf.*;   
			
				import org.apache.hadoop.io.*;   
			
				import org.apache.hadoop.mapred.*;   
			
				import org.apache.hadoop.util.*;   
			
				public class WordCount {   
			
				       public static class Map extends MapReduceBase implements Mapper {   
			
				         private final static IntWritable one = new IntWritable(1);   
			
				         private Text word = new Text();   
			
				         public void map(LongWritable key, Text value, OutputCollector output, Reporter reporter) throws IOException {   
			
				           String line = value.toString();   
			
				           StringTokenizer tokenizer = new StringTokenizer(line);   
			
				           while (tokenizer.hasMoreTokens()) {   
			
				             word.set(tokenizer.nextToken());   
			
				             output.collect(word, one);   
			
				           }   
			
				         }   
			
				       }   
			
				       public static class Reduce extends MapReduceBase implements Reducer {   
			
				         public void reduce(Text key, Iterator values, OutputCollector output, Reporter reporter) throws IOException {   
			
				           int sum = 0;   
			
				           while (values.hasNext()) {   
			
				             sum += values.next().get();   
			
				           }   
			
				           output.collect(key, new IntWritable(sum));   
			
				         }   
			
				       }       
			
				       public static void main(String[] args) throws Exception {   
			
				         JobConf conf = new JobConf(WordCount.class);   
			
				         conf.setJobName("wordcount");   
			
				         conf.setOutputKeyClass(Text.class);   
			
				         conf.setOutputValueClass(IntWritable.class);   
			
				         conf.setMapperClass(Map.class);   
			
				         conf.setCombinerClass(Reduce.class);   
			
				         conf.setReducerClass(Reduce.class);   
			
				         conf.setInputFormat(TextInputFormat.class);   
			
				         conf.setOutputFormat(TextOutputFormat.class);   
			
				         FileInputFormat.setInputPaths(conf, new Path(args[0]));   
			
				         FileOutputFormat.setOutputPath(conf, new Path(args[1]));   
			
				         JobClient.runJob(conf);   
			
				       }   
			
				    }

直接运行会报错报错了 (需要两个参数) 参考文档

可以根据根据DFS 中的目录进行设置也可以直接写绝对目录如图

点击运行成功

通过

hadoop dfs -cat /home/hadoop-1.2.1/output/part-00000 可以查看输出也可以在eclipse中dfs目录进行查看

阅读(867) | 评论(0) | 转发(0) |

上一篇：hadoop 1.2.1 配置学习笔记(一)

下一篇：hadoop格式化失败原因 Format aborted in /data0/hadoop-name

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6