Spark 安装及使用详解-xuemling-ChinaUnix博客

个人简介

...

文章分类

文章存档

2015年（34）

2011年（14）

相关博文

Spark 安装及使用详解

分类： HADOOP

2015-09-17 16:02:21

Spark配置文件

点击(此处)折叠或打开

export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=1.hadoop.com:2181,2.hadoop.com:2181,3.hadoop.com:2181 -Dspark.deploy.zookeeper.dir=/spark "
export SPARK_DAEMON_MEMORY=512m

编辑 spark-defaults.conf 文件
第一种配置方式 Yarn 模式

点击(此处)折叠或打开

第二种配置方式 standalone方式

点击(此处)折叠或打开

spark 集群安装
saprk 集群安装比较简单，按照以上配置，接着 scp 到其他节点，接着启动集群，不过spark对内存的要求比较高，有条件的，可以找些内存较大的机器，接着就是如何启动了
点击(此处)折叠或打开

spark 客户端模式
操作一：saprk-submit：计算不重复字符数

点击(此处)折叠或打开

WordCount.py 内容

点击(此处)折叠或打开

操作二：beeline 模式
这个首先在启动spark其群的JDBC-server，然后通过 spark/bin 目录下的命令行工具 beeline 去连接
这个参见我的博客： 《使用spark-sql 的JDBC server》

待续。。。。。

阅读(1800) | 评论(0) | 转发(0) |

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们