前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >用IntelliJ IDEA提交pyspark程序

用IntelliJ IDEA提交pyspark程序

作者头像
用户1148523
发布2018-01-09 11:10:05
1.9K0
发布2018-01-09 11:10:05
举报
文章被收录于专栏:FishFish

最近要用python写spark程序。因为idea如此强大,因此要写一个如何在idea上提交pyspark程序。

安装python组件

不管怎么样,想要在idea编写python需要安装组件。如图:

安装python插件
安装python插件

新建Python工程

插件安装好之后,你就可以新建一个python工程了:

新建python工程
新建python工程

可能很多小朋友找不到这个页面,其实在打开工程的时候,左上角file->close project就可以了。然后Create New Project:

创建
创建

next之后取个名字HelloPython之后finishi就获得了一个Python工程。 之后右键new一个Python工程。

配置环境

这里的pi.py文件是从$SPARK_HOME/examples/src/main/python中复制的,有需要的小伙伴可以从这里找样例程序

首先你的~/.bashrc或者/etc/profile里要设置好如下的内容:

代码语言:javascript
复制
export SPARK_HOME=/home/fish/workspace/spark_compile/spark
export PYTHONPATH=$SPARK_HOME/python/:$SPARK_HOME/python/lib/py4j-0.8.2.1-src.zip:$PYTHONPATH

然后在idea中 run->Edit Configurations->Environment->Environment Variables 添加如下设置:

添加环境变量
添加环境变量

其中PYTHONPATH填入的是spark目录下的python目录。

关联源码

这样虽然可以运行程序,但是无法进入到源码中实际看看到底是什么原理,因此要关联源码。 首先file->project structure->modules,点击最右侧加号:

添加源码
添加源码

选择第一个jars or directories.找到你的PYTHONPATH下的lib文件夹,直接添加进来就可以了。

至此,就可以用idea写pyspark的程序并查看源码了,但是发现pyspark的源码都特别简单,而且有很多都省略的,至于它们是怎么转化成scala语言与spark关联的需要日后研究。以上。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017年04月15日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 安装python组件
  • 新建Python工程
  • 配置环境
  • 关联源码
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档