当我尝试创建一个简单的数据集并将其打印出来时,我得到了以下错误消息。/pyspark/worker.py", line 267, in main
("%d.in driver 3.7, PySpark cannot run with different minor versions.Please check environment variables PYSPARK_PYTHONand PYSPARK_<
我使用的是jupyter的pyspark和graphframes。我能够成功地导入pyspark和graphframes,但当我尝试时: from graphframes.lib import Pregel 我得到以下错误: ImportError: cannot# Set environment to use Jupyter
export PYSPARK_DRIVER_PYTHON=ju
我按照上给出的说明操作,但每次打开一个新的pyspark笔记本时,我仍然收到以下内核错误。我该如何着手解决这个问题呢?NotebookApp] Failed to run command:
[u'/anaconda/bin/python', u'-m', u'ipykernel', u'-f', u'/run/user/1000/jupyterre
我已经在这个问题上挣扎了四天了,我在Stackoverflow上查看了几个处理相同问题的网页,但没有得到解决方案。我安装了findspark,然后在我的JupyterNotebook中启动了pyspark。问题是当我运行以下命令时:我得到以下错误:
java gateway process exited before sendingthe driver