在Windows下的Eclipse中如何将WordCount程序提交到集群运行,能调试-pamire-ChinaUnix博客

进步每一天pamire.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

pamire

博客访问： 2734361
博文数量： 416
博客积分： 10220
博客等级：上将
技术积分： 4193
用户组：普通用户
注册时间： 2006-12-15 09:47

文章分类

全部博文（416）

math（1）
android（6）
QT4（37）
邮件系统（6）
财经（1）
多媒体（59）

H264（5）

MPEG（6）

DirectShow（44）
数据库（3）

mongo（0）

ORACLE（2）

MYSQL（0）
程序语言（242）

脚本（22）

MFC（15）

COM（7）

PHP（9）

JAVA（5）

C++（78）

C语言（12）

VC（89）
杂谈（24）
算法（2）
搜索（4）

clucene（2）

lucene（2）
分词（21）

产品（4）

编码（3）
LINUX（4）
未分配的博文（6）

文章存档

2022年（1）

2021年（1）

2020年（1）

2019年（5）

2018年（7）

2017年（6）

2016年（7）

2015年（11）

2014年（1）

2012年（5）

2011年（7）

2010年（35）

2009年（64）

2008年（48）

2007年（177）

2006年（40）

我的朋友

jpwang09

相关博文

在Windows下的Eclipse中如何将WordCount程序提交到集群运行,能调试

分类： Java

2016-12-30 11:09:21

参考内容: http://blog.csdn.net/deng2012web/article/details/51931686

java程序：

package com.hq;

import org.apache.hadoop.conf.Configuration;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaPairRDD;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.FlatMapFunction;
import org.apache.spark.api.java.function.Function2;
import org.apache.spark.api.java.function.PairFunction;
import scala.Tuple2;

import java.util.Arrays;
import java.util.Iterator;
import java.util.List;
import java.util.regex.Pattern;

public final class JavaWordCount {
private static final Pattern SPACE = Pattern.compile(" ");

public static void main(String[] args) throws Exception {

    if (args.length < 1) {
      System.err.println("Usage: JavaWordCount ");
      System.exit(1);
    }

    Configuration conf = new Configuration();
    conf.set("fs.defaultFS", "hdfs://master:9000");
    conf.set("mapreduce.jobtracker.address", "master:9001");
    conf.set("yarn.resourcemanager.address", "master:8032");
    conf.set("mapreduce.framework.name", "yarn");
    conf.set("mapreduce.opp-submission.cross-platform", "true");
    conf.set("yarn.resourcemanager.scheduler.address", "master:8030");

    SparkConf sparkConf = new SparkConf().setAppName("JavaWordCount");
    JavaSparkContext ctx = new JavaSparkContext(sparkConf);
    JavaRDD lines = ctx.textFile(args[0], 1);

    JavaRDD words = lines.flatMap(new FlatMapFunction() {
      @Override
      public Iterator call(String s) {
          return Arrays.asList(SPACE.split(s)).iterator();
        }
    });

    JavaPairRDD ones = words.mapToPair(new PairFunction() {
      @Override
      public Tuple2 call(String s) {
        return new Tuple2(s, 1);
      }
    });

    JavaPairRDD counts = ones.reduceByKey(new Function2() {
      @Override
      public Integer call(Integer i1, Integer i2) {
        return i1 + i2;
      }
    });

    List> output = counts.collect();
    for (Tuple2 tuple : output) {
      System.out.println(tuple._1() + ": " + tuple._2());
    }
    ctx.stop();
}
}

有关脚本：

spark-submit --master spark://master:7077 --name WordCountByscala --class com.hq.WordCount --executor-memory 1G --total-executor-cores 2 jars/spark-wordcount-in-scala.jar hdfs://master:9000/user/word.txt
spark-submit --master spark://master:7077 --name JavaWordCountByHQ --class com.hq.JavaWordCount --executor-memory 1G --total-executor-cores 2 jars/spark-wordcount-in-scala.jar hdfs://master:9000/user/word.txt

spark-submit --master spark://192.168.0.76:7077 --name JavaWordCountByHQ --class com.hq.JavaWordCount --executor-memory 1G --total-executor-cores 2 spark-wordcount-in-scala.jar hdfs://192.168.0.76:9000/user/word.txt

spark-submit --master spark://master --name JavaWordCountByHQ --class com.hq.JavaWordCount --executor-memory 1G --total-executor-cores 2 spark-wordcount-in-scala.jar hdfs://master:9000/user/word.txt

阅读(1777) | 评论(0) | 转发(0) |

上一篇：ubuntu15 nginx+php5-fpm配置,nginx不解析php问题

下一篇：HIVE备份之批量导出所有的HIVE建表字段

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6