Spark-Sql On YARN自动调整Executor数量配置-xuemling-ChinaUnix博客

谷雨时节

首页　| 　博文目录　| 　关于我

xuemling

博客访问： 390051
博文数量： 67
博客积分： 1486
博客等级：上尉
技术积分： 610
用户组：普通用户
注册时间： 2010-07-22 18:38

个人简介

...

文章分类

全部博文（67）

C/C++程序设计（8）
LinuxShell（16）
VIM（1）
linux程序调试（2）
linux常用命令（14）
AI（1）
Python总结（1）
HadoopHA（10）
内存数据库（9）
Java程序设计（2）
linux内核与驱动（3）
未分配的博文（0）

文章存档

2021年（2）

2016年（9）

2015年（34）

2011年（14）

2010年（7）

一：

在所有的NodeManager中，修改yarn-site.xml，为yarn.nodemanager.aux-services添加spark_shuffle值，设置yarn.nodemanager.aux-services.spark_shuffle.class值为org.apache.spark.network.yarn.YarnShuffleService，如下：

点击(此处)折叠或打开

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle,spark_shuffle<alue>
</property>
<property>
<name>yarn.nodemanager.aux-services.spark_shuffle.class</name>
<value>org.apache.spark.network.yarn.YarnShuffleService</value>
</property>

二：

将 $SPARK_HOME/lib/spark-1.4.0-yarn-shuffle.jar文件拷贝到hadoop-yarn/lib目录下（即yarn的库目录）

将这个jar包复制到 hadoop/share/hadoop/yarn 这个路径下
或者软连接处理

备注：
这个操作在所有的 nodemanager 中操作

三：

配置 $SPARK_HOME/conf/spark-default.xml，内容如下

点击(此处)折叠或打开

spark.dynamicAllocation.minExecutors 1 #最小Executor数
spark.dynamicAllocation.maxExecutors 100 #最大Executor数

四：

执行时开启自动调整Executor数开关，以spark-sql yarn client模式为例：

点击(此处)折叠或打开

spark-sql --master yarn --deploy-mode client --conf spark.shuffle.service.enabled=true --conf spark.dynamicAllocation.enabled=true -e "SELECT COUNT(*) FROM xx"

对于使用spark-submit也是一样：
点击(此处)折叠或打开

spark-submit \
--class SySpark.SqlOnSpark \
--master yarn-client \
--conf spark.shuffle.service.enabled=true \
--conf spark.dynamicAllocation.enabled=true \
/data/jars/SqlOnSpark.jar \
"SELECT COUNT(*) FROM xx"

链接地址：http://doc.okbase.net/simplefocus/archive/123088.html

阅读(7913) | 评论(0) | 转发(0) |

上一篇：大数据时代的技术【一】Hive

下一篇：使用Spark SQL 的JDBC server

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6