使用docker搭建hadoop-spark环境-cokeboL-ChinaUnix博客

cokeboL

首页　| 　博文目录　| 　关于我

cokeboL

博客访问： 485125
博文数量： 280
博客积分： 337
博客等级：二等列兵
技术积分： 1957
用户组：普通用户
注册时间： 2011-04-17 21:36

文章分类

全部博文（280）

音视频（1）
ed2000（0）
python（1）
web（3）
python（1）
docker（2）
docker（0）
hadoop（3）
linux（25）
c++（16）
实用代码段（2）
有趣的题目（4）
算法（1）
server（23）
android（3）
手游整体分析（0）
protobuf（3）
行业（0）
opengl（7）

GLSL教程（0）
U3D（4）
golang（20）
iOS调试（5）
polemo（3）
flash（3）
Lua（19）
Java（1）
招聘（1）
cocos2d-x（77）

Tiled Map（3）
Android（3）
C++（37）
APUE读书笔记（5）
未分配的博文（7）

文章存档

2017年（13）

2016年（38）

2015年（78）

2014年（67）

2013年（70）

2012年（14）

我的朋友

相关博文

使用docker搭建hadoop-spark环境

分类： HADOOP

2015-12-23 13:29:36

1.安装ubuntu-server14.04
2.ubuntu-server14.04安装docker
sudo apt-get install docker-io
3.pull hadoop-docker镜像
docker pull sequenceiq/hadoop-docker:2.7.1
docker run -it sequenceiq/hadoop-docker:2.7.1 /etc/bootstrap.sh -bash
参考

这个好像已经带spark了

增加部署spark
4.yum install wget
5.下载安装spark
wget
mv spark-1.5.2-bin-without-hadoop.tgz /usr/local
tar -xf spark-1.5.2-bin-without-hadoop.tgz
mv spark-1.5.2-bin-without-hadoop spark
vi /etc/profile，增加：
    export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
   export SPARK_HOME=/usr/local/spark
   export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin:$JAVA_HOME/bin
   export SPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoop classpath)
source /etc/profile
run-examples SparkPi 10
pyspark
6.保存镜像
exit
docker commit id hadoop-docker-spark
7.打开镜像
sudo docker run -ti hadoop-docker-spark /etc/bootstrap.sh -bash
source /etc/profile
run-examples SparkPi 10
pyspark

测试：
cd /usr/hadoop
bin/hdfs dfs -put datafile /datafile
pyspark
>>>>> lines = sc.textFile("/datafile")
>>>>> lines.count()
>>>>> lines.first()

阅读(3818) | 评论(0) | 转发(0) |

上一篇：Nginx深入详解之日志

下一篇：Docker之常用命令

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6