如何从python复制pyspark / hadoop中的文件_使用pyspark从Hadoop中删除文件(查询)_使用org.apache.hadoop从pyspark中的s3读取文件 - 腾讯云开发者社区

pyspark、hadoop-yarn、jupyterhub、spark-ec2

我目前的设置： rdd = sc.parallelize([1, 2])在PySpark json文件中，按照预期的方式工作的内核在内核json文件中具有以下环境变量： &qu

浏览 0提问于2016-12-12得票数 0

回答已采纳

4回答

Pyspark集成到Pycharm中

pycharm、pyspark、elasticsearch

我不知道如何配置Pycharm，这样我就可以直接在Pyspark中运行脚本。我在Elasticsearch集群上使用Pyspark，并使用以下代码来运行脚本。当我尝试将pyspark shell配置为解释器时，它使用默认的python解释器运行，但由于错误it I not a valid SDK而无法工作： keyClass="org.apache.<em

浏览 1提问于2015-07-22得票数 3

6回答

无法安装pyspark

python、pyspark

我正在尝试安装pyspark，如下所示：我得到了这个错误：已经安装了pypandoc 有什么办法可以安装pyspark吗？

浏览 6提问于2018-07-24得票数 15

1回答

在本地机器上安装火花- .getOrCreate火花会话未完成

python、java、apache-spark、pyspark、anaconda

我已装好并安装：SPARK_HOME=C:\spark\spark-3.0.3-bin-hadoop2.7HA

浏览 3提问于2022-02-24得票数 1

2回答

如何使用pyspark在s3上获取csv (方案无FileSystem : s3n)

python、apache-spark、pyspark

尝试从我的s3加载一个简单的测试csv文件。就像下面这样，在本地做这件事是可行的。from pyspark.sql import SparkSessionlines.count() 我得到了： No FileSystem for scheme: s3n 我还尝试

浏览 46提问于2019-01-25得票数 3

1回答

生产用火花安装，pip安装还是不安装？

apache-spark、pyspark、pip

我想安装Pyspark 2.4.4。我已经看到我可以下载星火软件包或使用pip安装。我只需要火花放电，这两种装置是一样的吗？

浏览 1提问于2020-01-27得票数 0

回答已采纳

2回答

Python运行火花的几个问题

python、pyspark

两个问题：如何在火花模块中运行python3？我运行/bin/.pyspark，它自动运行Python2.7。如何运行Python3？在我运行pyspark之后，它会弹出如下警告: 16/12/29 17:33:37警告NativeCodeLoader:无法为您的平台加载本机hadoop库.如果适用的话，使用内置java类是否意味着我下载了错误的

浏览 2提问于2016-12-30得票数 2

11回答

org.apache.spark.api.python.PythonUtils.getEncryptionEnabled : JVM中不存在org.apache.spark.api.python.PythonUtils.getEncryptionEnabled

python、python-3.x、pyspark

我目前正在使用JRE: 1.8.0_181，Python3.6.4，spark: 2.3.2from pyspark.sql import SparkSession\site-packages\pyspark\context.py"，getOrCreate SparkContext(conf=conf或SparkConf())文件行118中，在init conf、jsc、profiler_cls中，<e

浏览 0提问于2018-11-08得票数 55

1回答

在映射转换中使用自定义函数

python、apache-spark、pyspark

"/home/osboxes/spark-1.5.2-bin-hadoop2.4/python/lib/pyspark.zip/pyspark/worker.py", line 98, in main_read_with_length(infile) File "/home/osboxes/spark-1.5.2-bin-hadoop2.4/py

浏览 2提问于2016-06-07得票数 1

1回答

如何从python复制pyspark* / hadoop中的文件*

python、apache-spark、hadoop、pyspark、pyspark-sql

我使用pyspark将数据框保存为拼图文件或csv文件，如下所示： def write_df_as_parquet_file(df, path, mode="overwrite"): df =path的文件夹中，它会以这种方式保存一些我们不需要的其他文件： ? 图片来源：https://ibb.co/9c1D8RL 基本上，我想创建一些函数，使用上面的方法将文件保存到一个

浏览 14提问于2019-02-05得票数 1

2回答

在窗户上安装火花放电

python、apache-spark、pyspark

我可以在我的窗户上做一个pip install pyspark。当我试图在下面运行一个示例脚本时，它告诉我没有设置我的SPARK_HOME。我是否需要将我的SPARK_HOME设置为静止状态，以及如何进行此操作？我在网上提到的博客做了一个从火花网站的火花文件的手动提取，然后他们不得不把SPARK_HOME和PYTHONPATH。然而，我认为pip install pyspark已经消除了这一点。i

浏览 0提问于2018-04-04得票数 4

1回答

在AWS EMR木星笔记本中，如何将用户从livy更改为hadoop

amazon-web-services、jupyter-notebook、hadoop-yarn、amazon-emr、livy

我创建了一个AWS电子病历集群并上传了，并创建了一本EMR朱庇特笔记本，下面的代码认为它将从用户(、hadoop、)主目录中读取。/lib/pyspark.zip/pyspark/sql/readwriter.py", line 274, in json return self.如何将jupyter笔记本中的用户从livy更改为

浏览 1提问于2019-10-23得票数 0

2回答

Livy在120秒内未找到带有标记livy-batch-10-hg3po7kp的纱线应用程序

apache-spark、amazon-s3、amazon-emr、livy

使用Livy通过从电子病历启动的POST请求执行存储在S3中的脚本。脚本会运行，但很快就会超时。我尝试过编辑livy.conf配置，但似乎所有更改都没有生效。这是返回的错误： java.lang.Exception: No YARN application is found with tag livy-batch-10-hg3po7kp in 120 seconds

浏览 3提问于2018-11-29得票数 3

4回答

触发Python错误"FileNotFoundError：[WinError 2]系统找不到指定的文件“

python、python-3.x、apache-spark、pyspark

我是斯派克和Python的新手。我在windows上安装了python 3.5.1和Spark-1.6.0-bin-hadoop2.4。("local", "Simple App")SparkContext_ensure_initi

浏览 4提问于2016-02-17得票数 8

1回答

在Google Colab环境中PySpark从Aws-S3读取时引发的ClassNotFoundException

amazon-s3、pyspark、google-colaboratory

Google Colab research是测试python、数据挖掘和深度学习的一个很好的工具，我想基于pyspark在它上面运行spark作业，当我在Google Colab Pyspark脚本中从S3读取时，我得到了错误： /usr/local/lib/python3.6/dist-packages/py4j/protocol.py in get_return_value(an

浏览 0提问于2020-11-02得票数 0

6回答

使用python 3.5.1导入pyspark错误Pyspark

python、apache-spark、pyspark、apache-spark-sql、python-3.5

我安装了python 3.5.1 (从源代码安装)，当我在终端中运行pyspark时，我得到这个错误[GCCTraceback (most recent call last): File "/home/himaprasoon/apps/spark-1.6.0-bin-hadoop2.6/python/<

浏览 4提问于2016-04-25得票数 1

1回答

在本地运行pyspark

python、apache-spark、pyspark

我试着遵循这本书中的说明： scala> val file = sc.textFile("C:\\war_and_peace.txt") scala> val warsCount = file.fil

浏览 2提问于2017-04-17得票数 5

回答已采纳

1回答

派斯卡姆：\Anaconda3\envs\xgboost\python.exe]这个时候出乎意料

python、python-3.x、apache-spark、pyspark、anaconda

我正试图在Windows中安装Pyspark。我将setx应用于以下方面：HADOOP_HOME"C:\spark\hadoop"PYSPARK_DR

浏览 0提问于2018-10-03得票数 0

回答已采纳

6回答

朱庇特电火花:无模块名为火星雨

python、ipython、pyspark、jupyter、apache-toree

现在，当我尝试在笔记本中运行任何RDD操作时，会引发以下错误 /usr/bin/python: No module named pyspark /private/tmp/hadoop-xxxx/nm-local-dir/usercache/xxxx/filecache/33/spark-assemb

浏览 3提问于2017-02-03得票数 9

回答已采纳

3回答

运行火花时出错

pyspark、jupyter

从我的终端，我运行snotebook，它将自动加载木星。在此之后，当我选择python3时，错误就来自终端。处理PYTHONSTARTUP文件/Users/simon/spark-1.6.0-bin-hadoop2.6/python/pyspark/shell.py中的IPKernelApp警告 export

浏览 10提问于2017-10-04得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

PySpark内核(JupyterHub)能否在纱线-客户端模式下运行？

Pyspark集成到Pycharm中

无法安装pyspark

在本地机器上安装火花- .getOrCreate火花会话未完成

如何使用pyspark在s3上获取csv (方案无FileSystem : s3n)

生产用火花安装，pip安装还是不安装？

Python运行火花的几个问题

org.apache.spark.api.python.PythonUtils.getEncryptionEnabled : JVM中不存在org.apache.spark.api.python.PythonUtils.getEncryptionEnabled

在映射转换中使用自定义函数

如何从python复制pyspark* / hadoop中的文件*

在窗户上安装火花放电

在AWS EMR木星笔记本中，如何将用户从livy更改为hadoop

Livy在120秒内未找到带有标记livy-batch-10-hg3po7kp的纱线应用程序

触发Python错误"FileNotFoundError：[WinError 2]系统找不到指定的文件“

在Google Colab环境中PySpark从Aws-S3读取时引发的ClassNotFoundException

使用python 3.5.1导入pyspark错误Pyspark

在本地运行pyspark

派斯卡姆：\Anaconda3\envs\xgboost\python.exe]这个时候出乎意料

朱庇特电火花:无模块名为火星雨

运行火花时出错

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐