高效搭建Spark完全分布式集群

问题导读
1、如何高效安装Spark分布式集群？
2、如何安装Hadoop集群和scala？

写在前面一：
本文详细总结Spark分布式集群的安装步骤，帮助想要学习Spark的技术爱好者快速搭建Spark的学习研究环境。

写在前面二：
使用软件说明

约定，Spark相关软件存放目录：/usr/local/yujianxin/spark，

Hadoop相关软件存放目录： /home/yujianxin/hadoop。

Spark集群示意图

一、具体安装步骤
1、安装jdk

2、安装Hadoop集群，参考：hadoop2.2完全分布式最新高可靠安装文档

3、安装 Scala

cd /usr/local/yujianxin/spark/
tar -zxvf scala-2.9.3.tgz
复制代码

修改/etc/profile

4、安装Spark

4.1、修改/etc/profile

cd /usr/local/yujianxin/spark/
tar -zxvf spark-0.7.2-prebuilt-hadoop1.tgz
复制代码

4.2、配置Spark
4.2.1、修改配置文件spark-env.sh

cd /usr/local/yujianxin/spark/spark-0.7.2/conf
cp spark-env.sh.template spark-env.sh
vi spark-env.sh
复制代码

4.2.2、修改配置文件slaves

至此，master节点上的Spark已配置完毕。把master上Spark相关配置copy到slave1、slave2中，注意，三台机器spark所在目录必须一致，因为master会登陆到worker上执行命令，master认为worker的spark路径与自己一样。

二、安装测试
2.1、通过命令行

cd $SPARK_HOME/bin
start-all.sh
复制代码

2.2、通过浏览器

anyhuayong · 发表于 2014-9-11 22:01:51

好文章必须回复

dongnanyouwo · 发表于 2014-9-12 08:49:07

不错，好东西。

图文精华

高效搭建Spark完全分布式集群

已有(2)人评论

最佳新人

活跃会员

突出贡献

论坛元老

推荐 /2