在Python notebook中配置Spark时出现运行时错误_在Jupyter notebook中插入图像时出现错误_在Juypter Notebook中导入python文件时出现缩进错误 - 腾讯云开发者社区

、、

我正在尝试使用这个Python notebook。我直接在notebook (!pip install pyspark)中安装了Spark，但当我这样做时： spark = SparkSession \ .appName("question recommendation") \ .config("spark.driver.maxResultSize", "9

浏览 151提问于2021-11-17得票数 0

回答已采纳

3回答

如何从jupyter笔记本访问pyspark

、

我已经在Ubuntu14.04上的ipython笔记本中成功地使用了pyspark和Python2.7，为spark创建了一个特殊的配置文件，并通过调用$ipython notebook --profile许多网站上都给出了创建spark配置文件的机制，但我使用的是中给出的机制。(SPARK_HOME, "python")) 我刚刚为我的学生创建了一个新的Ubuntu16.04虚

浏览 1提问于2016-06-25得票数 0

5回答

KernelRestarter:在jupyter中重新启动失败，内核已死

、、、、

[I 10:43:53.627 NotebookApp] 启动notebooks 在本地路径: /opt/soft/recommender/jupyter PYSPARK_DRIVER_PYTHON="jupyter" PYSPARK_DRIVER_PYTHON_OPTS="notebook/spark-2

浏览 12提问于2018-10-10得票数 2

2回答

带有Spark 2.0的Python 2

如何使用spark 2.0为Python2/3创建Spark服务。每当我创建一个新服务并将其与python笔记本相关联时，它的Python2与Spark 1.6。为什么我看不到我正在创建的服务的配置，就像在Data bricks免费版中一样？我想使用Spark2.0中引入的Spark api来创建您的SparkSession会话变量，因此出现了这个问题。

浏览 15提问于2017-08-27得票数 0

1回答

在Spark作业中获取Databricks集群ID (或获取集群链接

、

我想要在一个正在运行的Spark作业中获取集群链接(或手动组成链接的集群ID )。这将用于打印警报消息中的链接，使工程师更容易访问日志。在Databricks中运行的Spark作业有可能实现这一点吗？

浏览 35提问于2021-06-30得票数 3

回答已采纳

2回答

在电子病历笔记本电脑中设置spark.driver.maxResultSize

、、、

我在emr中使用Jupyter notebook来处理大量数据。在处理数据时，我看到了这个错误：似乎我需要更新sp

浏览 29提问于2020-05-11得票数 3

回答已采纳

1回答

线程"main“中出现异常:java.lang.IllegalArgumentException不支持任何应用程序选项

在pyspark中配置jupyter notebook时，它有一些错误:在.bashrc文件中：export PYSPARK_DRIVER_PYTHON=jupyter export PYSPARK_DRIVER_PYTHON_OPTS="notebook -

浏览 2提问于2017-06-25得票数 0

2回答

在创建增量表时使用Pyspark Py4JJavaError

、、、、

builder).getOrCreate()None.org.apache.spark.api.java.JavaSparkContext.：调用Py4JJavaError时出错：java.lang.IllegalAccessError: org.apache.spark.storage.StorageUtils$类(在未命名模块@0x30cb5b99中)无法访问类sun.nio.ch.DirectBuffer (在模块java.base中)

浏览 11提问于2022-01-17得票数 3

1回答

Pyspark (SparkContext)：java网关进程在向驱动程序发送其端口号之前退出

、、

我已经在这个问题上挣扎了四天了，我在Stackoverflow上查看了几个处理相同问题的网页，但没有得到解决方案。我安装了findspark，然后在我的Jupyter Notebook中启动了pyspark。问题是当我运行以下命令时：我得到以下错误：值得一提的

浏览 0提问于2018-04-03得票数 4

回答已采纳

2回答

运行./pyspark无法找到本地目录

、

在安装Spark之后，我尝试从安装文件夹运行PySpark：但是我得到了以下错误：opt/spark/b

浏览 5提问于2020-04-24得票数 1

4回答

Azure HDInsight Jupyter笔记本不工作

、

我已经在Microsoft Azure上部署了一个HDInsight 3.6 Spark (2.3)集群，使用标准配置(Location = Central US，Head Nodes = D12 v2启动Jupyter notebook，当选择spark notebook时，会出现一个奇怪的错误，我无法确定。

浏览 0提问于2020-01-11得票数 1

2回答

Pyspark与Jupyter的集成

、

我已经在我的机器上安装了Anaconda(Python2.7版本)，并用"PYSPARK_DRIVER_PYTHON=jupyter“和PYSPARK_DRIVER_PYTHON_OPTS=" notebook”启动了jupyter笔记本，我正在连接到jupyter notebook，但也无法运行“打印”命令。当我运行该命令时，它将转到下一行，但没有显示输出，打印也没有以颜色突出显示。我已经安装了pyspark并在我的windows机器(独立模式)的

浏览 1提问于2017-04-04得票数 1

2回答

当调用其他笔记本时，Databricks笔记本超时错误: com.databricks.WorkflowException: java.net.SocketTimeoutException: Read

、、、

每个笔记本在delta表上执行一次合并，以更新或插入新记录。---------------------------------------------------------------------------<command-3958057957970596> in <module>

浏览 1提问于2019-08-16得票数 3

回答已采纳

1回答

如何在QDS上运行命令时更改超时值

、

我有一个spark-submit命令来调用我的python脚本。代码运行超过36小时，但是由于QDS超时限制为36小时，我的命令在36小时后被终止。有没有人可以帮我把这个参数值改成50小时？这就是我在QDS中调用脚本的方式 /usr/lib/spark/bin/spark-submit s3:/abc.py

浏览 16提问于2020-06-17得票数 0

5回答

PySpark无法启动-‘python’：没有这样的文件或目录

、、

我跟着这本指南走， http://jmedium.com/pyspark-in-python/ 当我在终端中运行'pyspark‘时， /home/jacob/spark-2.1.0-bin-hadoop2.7(有些指南在设置.profile时有不同的细节。我的.profile配置如下： #Spark and PySpark Setup PATH="$HOME&#

浏览 397提问于2018-09-06得票数 7

回答已采纳

1回答

在火花/木星中设置spark.local.dir

、、、

我正在使用木星笔记本中的Pyspark，并试图为S3编写一个大型的拼花数据集。如何设置这个参数？我发现的大多数解决方案都建议在使用火花提交时设置它。然而，我没有使用星火提交和运行它作为一个脚本从木星。编辑:我正在使用Spark魔术处理EMR后端，我认为需要在配置JSON中设置spark</e

浏览 2提问于2018-06-29得票数 4

1回答

如何在docker容器中安装不同的python版本

、、

我在我的机器中安装了gettyimages/spark docker映像和jupyter/pyspark-notebook。但是，由于gettyimage/spark python版本为3.5.3，而jupyter/pyspark-notebook python版本为3.7，因此出现以下错误：例外情况: worker中的因此，我尝试升级gettyimage

浏览 1提问于2019-08-16得票数 4

回答已采纳

3回答

ipython未被识别为内部或外部命令(pyspark)

、、、

我已经安装了spark发行版：spark-2.2.0-bin-hadoop2.7。我使用的是Windows 10 OS我设置了我的环境变量： PYSPARK_DRIVER_PYTHON_OPTS

浏览 1提问于2017-11-18得票数 3

2回答

尝试在上使用Python注册UDF时，我收到关于Spark* BUILD with HIVE的错误*

、

Exception：(“必须使用配置单元构建Spark。导出'SPARK_HIVE=true‘并运行build/sbt程序集”，Py4JJavaError(调用None.org.apache.spark.sql.hive.HiveContext.\n'，JavaObject id=o54时出错)) 每当我在IBM Bluemix Spark as a Service上的Jupyter中的第二个笔记本上创建UDF时<

浏览 4提问于2016-05-11得票数 1

1回答

findspark.init()失败-无法正确设置SPARK_HOME环境变量

、、

我刚开始使用Spark，我正在尝试使用Jupyter Notebook在我的本地(windows)计算机上玩Spark 我遵循了几个关于设置环境变量的教程，以及通过Python和cmd使用多个函数来设置环境变量运行时(在Jupyter Notebook中，使用Python) from pyspark import SparkContext from pyspark.sql import SQLContext\

浏览 124提问于2019-07-03得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云