前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Windows7下安装pyspark

Windows7下安装pyspark

作者头像
机器学习和大数据挖掘
发布2019-07-02 09:17:01
1.9K0
发布2019-07-02 09:17:01
举报
文章被收录于专栏:数据挖掘数据挖掘

安装需要如下东西:

java

jdk-8u181-windows-x64.exe

spark

spark-2.1.3-bin-hadoop2.7

hadoop(版本要与spark的一致,这里都是hadoop2.7)

hadoop-2.7.7

Anaconda(这个是为了预防python出现api-ms-win-crt-runtime-l1-1-0.dll错误,且安装了vc_redist.2015.exe还无法解决时需要安装)

Anaconda3-2.4.1-Windows-x86_64.exe

python

python-3.5.4-amd64.exe

pycharm

pycharm-community-2016.1.4.exe

安装JDK

** 千万不要用默认路径Program Files,这个有空格后面会很坑!新建路径在C:\Java,Java安装在这里!**

  1. 新建环境变量名:JAVA_HOME,变量值:C:\Java\jdk1.8.0_11
  2. 打开PATH,添加变量值:%JAVA_HOME%\bin;%JAVA_HOME%\jre\bin
  3. 新建环境变量名:CLASSPATH,变量值:.;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar

cmd 中输入 java 出现如下信息就算安装成功了

安装spark

在C盘新建Spark目录,将其解压到这个路径下

  1. 新建环境变量名:SPARK_HOME,变量值:C:\Spark
  2. 打开PATH,添加变量值:%SPARK_HOME%\bin

安装hadoop

在C盘新建Hadoop目录,将其解压到这个路径下

  1. 新建环境变量名:HADOOP_HOME,变量值:C:\Hadoop
  2. 打开PATH,添加变量值:%HADOOP_HOME%\bin

去网站下载Hadoop在Windows下的支持winutils

https://github.com/steveloughran/winutils

根据版本来选择,这里用的是 hadoop2.7,所以选择2.7bin下载下来,将其覆盖到 C:\Hadoop\bin

修改C:\Hadoop\etc\hadoop下的hadoop-env.cmd为set JAVA_HOME=C:\Java\jdk1.8.0_11

cmd 中输入 hadoop 出现如下信息就算安装成功了

安装python

安装路径为 C:\Python35

在C盘或者代码盘新建\tmp\hive路径,输入命令

代码语言:javascript
复制
winutils.exe chmod -R 777 C:\tmp\hive

验证pyspark

cmd输入pyspark得到如下画面

配置pycharm

在如下路径添加环境变量

  1. JAVA_HOME
  2. SPARK_HOME
  3. HADOOP_HOME
代码语言:javascript
复制
Run->Edit Configurations->Environment variables
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018-08-28 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 安装JDK
  • 安装spark
  • 安装hadoop
  • 安装python
  • 验证pyspark
  • 配置pycharm
相关产品与服务
命令行工具
腾讯云命令行工具 TCCLI 是管理腾讯云资源的统一工具。使用腾讯云命令行工具,您可以快速调用腾讯云 API 来管理您的腾讯云资源。此外,您还可以基于腾讯云的命令行工具来做自动化和脚本处理,以更多样的方式进行组合和重用。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档