前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >hadoop 2.4.1 上安装spark 1.1.0

hadoop 2.4.1 上安装spark 1.1.0

作者头像
pydata
发布2018-08-02 12:02:09
3560
发布2018-08-02 12:02:09
举报
文章被收录于专栏:pydata

Yarn模式安装Spark 1.1.0

1.在github上下载Spark源码到本地:

代码语言:javascript
复制
git clone https://github.com/apache/spark.git
cd spark
git checkout v1.1.0 #取出1.1.0版本的saprk

2.修改pom.xml:

代码语言:javascript
复制
<protobuf.version>2.5.0</protobuf.version>  
#修改为hadoop所使用的对应hadoop版本

3.编译:

代码语言:javascript
复制
./make-distribution.sh --tgz --skip-java-test -Dyarn.version=2.4.1
-Dhadoop.version=2.4.1 -Pyarn
#生成spark-1.1.0-bin.tgz文件
tar -zxvf spark-1.1.0-bin.tgz 
mv spark-1.1.0-bin.tgz/* /usr/local/spark/
sudo adduser spark
chown -R spark.spark /usr/local/spark

4.添加环境变量:

代码语言:javascript
复制
export SPARK_HOME=/usr/local/spark
export
SPARK_HOME=$SPARK_HOME/lib/spark-assembly-1.0.2-hadoop2.4.1.jar
export PATH=$SPARK_HOME/bin:$PATH

5.修改conf目录下的spark-env.sh,添加环境变量:

代码语言:javascript
复制
export HADOOP_CONF=$HADOOP_INSTALL/etc/hadoop
export YARN_CONF_dIR=$HADOOP_INSTALL/etc/hadoop

6.测试:

代码语言:javascript
复制
spark-submit --class org.apache.spark.example.SparkPi --master \
yarn-cluster --num-executors 1 --driver-memory 1g --executor-memory
1g --executor-cores 1 lib/spark-examples*.jar 1

7.使用PySpark: 交互终端

代码语言:javascript
复制
pyspark --master yarn

Ipython Notebook 把下面代码加到~/.bashrc

代码语言:javascript
复制
function pyspark_yarn() {
PORT=$1
NOTEBOOK_DIR=$2
source /home/spark/pyenvs/py2.7/bin/activate   
export IPYTHON=1
export IPYTHON_OPTS="notebook --ip=0.0.0.0 --port=$PORT
--notebook-dir=$NOTEBOOK_DIR --matplotlib=inline --no-browser"
$SPARK_HOME/bin/pyspark --master yarn --deploy-mode client $*
--driver-memory 1G --num-executors 2 --executor-cores 2
}

source ~/.bashrc
pyspark port work_directory

进入到http://localhost:port访问Ipython Notebook

tips: mvn download the dependency libs to the dir lib mvn dependency:copy-dependencies -DoutputDirectory=lib -DincludeScope=compile

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2014年11月25日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Yarn模式安装Spark 1.1.0
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档