腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(2027)
视频
沙龙
1
回答
Spark
2.4.4
Avro
Pyspark
外壳
配置
、
、
、
我认为我遵循了正确的documentation来让
pyspark
编写
avro
文件。我正在运行
Spark
2.4.4
,我正在使用Jupyter lab来运行
pyspark
shell。os.environ['
PYSPARK
_SUBMIT_ARGS'] = '--packages org.apache.
spark
:
spark
-
avro
_2.12:
2.4.4
pyspark
-
浏览 104
提问于2019-10-16
得票数 1
回答已采纳
4
回答
用PyCharm读入电火花中的
avro
文件
、
、
、
我是个新手,我已经将
pyspark
库导入到pycharm中,并编写了以下代码:from
pyspark
.sql import SparkSession path = "file_path" df =
spark
.read.format("
avro
").loa
浏览 3
提问于2019-12-05
得票数 1
回答已采纳
2
回答
如何在
Spark
2.4中读取闪烁2-shell中的
Avro
文件?
、
我们使用以下方法读取
Spark
2.4 2.3中的
avro
文件,但这种支持在
Spark
2.4中已被删除:但是,在使用这种方法时,我们会得到以下异常: Exceptio
浏览 4
提问于2020-01-24
得票数 2
回答已采纳
3
回答
提供程序org.apache.
spark
.sql.
avro
.AvroFileFormat无法实例化
、
、
无法从星火流应用程序向Kafka主题发送
avro
格式消息。有关
avro
火花流示例代码的在线信息非常少。"to_
avro
“方法不需要
avro
,那么它将如何编码为
avro
?<dependency> <artifactId>
spark
-
avro
_2.12<
浏览 0
提问于2019-12-26
得票数 7
回答已采纳
1
回答
pyspark
代码在控制台中工作,但在zeppelin中不起作用
、
、
、
、
我有一个带有
Spark
2.4.4
和python 2.7.16的EMR (emr-5.28.0)。如果我ssh到集群并像这样执行
pyspark
:
pyspark
--jars /home/hadoop/jar/
spark
-redshift_2.11-2.0.1.jar,/home/hadoop/jar--packages org.apache.
spark
:
spark
-
avro
_2.1
浏览 4
提问于2019-11-19
得票数 0
回答已采纳
2
回答
如何读取Scala中的
Avro
二进制(Base64)编码数据
、
、
、
、
我正在尝试读取
avro
文件,该文件以二进制(Base64)编码,在
avro
文件上的snappy压缩Hadoop如下所示:binaryFilesRDD: org.apache.
spark
.rdd.RDD[Array[Byte]] = MapPartitionsRDD[1] at map at at org.ap
浏览 0
提问于2019-10-14
得票数 1
1
回答
PySpark
无法从Pycharm读取本地
Avro
文件
、
我有一个示例
avro
文件,并运行一个基本的
spark
应用程序来读取它: .builder \ .getOrCreate() .format("org.apache.
spark
.sql.
avro
.AvroFileFormat") \.load("
avr
浏览 1
提问于2021-11-03
得票数 1
6
回答
如何在
spark
中将
Avro
Schema对象转换为StructType
、
、
、
我有一个行类型的RDD,即RDDRow和
avro
schema对象.I需要用这个信息创建一个数据帧。 为了创建DataFrame,我需要将
avro
schema对象转换为StructType。
浏览 5
提问于2016-11-24
得票数 8
2
回答
使用Kafka将拼花文件写入S3 Sink
、
、
、
在这里,我使用
Pyspark
编写了Kafka,并且我能够成功地将JSON文件写入s3接收器。*工作守则:*
spark
= SparkSession\我从互联网上找到了下面的解决方案,但是我的数据是TB的,转换到
avro
需要很长时间。df =
spark
.read.json("src/main/
浏览 21
提问于2022-04-22
得票数 0
1
回答
从红移读取火花DataFrame返回空DataFrame
、
、
、
、
我在用:我使用EMR集群(emr-5.28.0)运行
pyspark
,并使用:
pyspark
--packages org.apache.
spark
:
spark
-
avro
_2.11:
2.4.4
url = "jdbc:redshift://my.cluster:5439/my_db?from schema.tab
浏览 2
提问于2019-11-20
得票数 2
回答已采纳
4
回答
由于AbstractMethodError,
spark
scala
avro
写入失败
、
我正在尝试从
avro
读取数据,按字段重新划分数据并将其保存为
avro
格式。下面是我的示例代码。在调试过程中,我不能在我的数据帧上显示(10)。它会失败,并显示以下错误。代码: df.sh
浏览 40
提问于2019-11-27
得票数 0
1
回答
用
Pyspark
内核读取Jupyter notebook中的
Spark
Avro
文件
、
、
我想在Jupyter笔记本上读一个
Spark
Avro
文件。
pyspark
--packages org.apache.
avro
:
avro
-mapred:1.7.7,com.databricks:
spark
-
avro
_2.10:例如,如果我必须使用
Spark
-csv包,我就会这样做在终端中,它打开了一个jup
浏览 10
提问于2017-02-07
得票数 1
回答已采纳
4
回答
Spark
Avro
在文件写入时抛出异常: NoSuchMethodError
、
、
、
我们使用的是
Spark
2.4.3 (用户提供的Hadoop),Scala 2.12,我们在运行时使用
spark
-shell加载
Avro
包:
spark
-shell --packages org.apache.
spark
:
spark
-
avro
_2.12:2.4.3 或者
spark
-submit:
spark
-submit --packages org.apache.
spark
:
spark
-
a
浏览 107
提问于2020-02-19
得票数 0
回答已采纳
1
回答
在
PySpark
中替换浮点型nan将0转换为空值
、
、
我有一些在我的
PySpark
数据帧中显示为NaN的值,我发现我可以将这些值转换为空值。然后,我通过将该值赋给其他值来调整这些空值。在执行此操作时,我发现它也将我的许多专栏中的0转换为NULL。cSchema = StructType([StructField("col", LongType())])test_df =
spark
.createDataFrame
浏览 2
提问于2020-02-27
得票数 0
1
回答
如何切换到较旧的火花放电版本?
、
、
、
、
我在我的Mac上安装了吡火花
2.4.4
。packages:
pyspark
Can't uninstall '
pyspark
'.Successfully installed
pyspark
-2.3.2 虽然运行在上面的命令看起来像是安装了
pyspark
2.3.2,但并没有覆盖现有的
pyspark
2.4.4
浏览 1
提问于2020-04-13
得票数 5
1
回答
java.lang.NoSuchMethodError: org.apache.scapk.内在.日志.$init$
、
、
、
from
pyspark
.sql.functions import split
spark
= SparkSession.builder.appName("StructuredN
浏览 6
提问于2020-04-16
得票数 2
2
回答
使用
pyspark
从s3读取/加载
avro
文件
、
、
、
使用AWS glue developer endpoint
Spark
Version - 2.4 Python Version- 3尝试读取
avro
文件时出现以下错误信息:Failed to find data source:
avro
.
Avr
浏览 0
提问于2020-09-18
得票数 2
1
回答
使用架构详细信息创建dataframe时,Dataproc上出现
Pyspark
错误
、
、
在anaconda my-env中,因为我需要在那里安装开源RDkit,因此我再次安装了
PySpark
(而不是使用预先安装的)。现在,使用下面的代码,我在my-env中得到了错误,但在my-env之外没有得到错误 代码: from
pyspark
.sql.types import StructField, StructType,StringType, LongTypefrom py4j.protocol import Py4JJavaError
spark
浏览 40
提问于2020-01-29
得票数 1
1
回答
在火花流/结构化流中阅读Kafka的
avro
消息
、
、
、
、
火花版本: 2.3.0卡夫卡版本: 2.2.0 我有一个卡夫卡生产者,它以
avro
格式发送嵌套数据,我正在尝试用火花流/结构化流写代码,这将反序列化从kafka到dataframe的
avro
,做转换,把它以拼花格式写成我能够在
spark
/scala中找到
avro
转换器,但是还没有增加对
pyspark
的支持。如何在火花放电中转换相同的内容。谢谢。
浏览 3
提问于2019-05-02
得票数 3
回答已采纳
2
回答
/
pyspark
无法找到本地目录
、
在安装
Spark
之后,我尝试从安装文件夹运行
PySpark
:但是我得到了以下错误:opt/
spark</e
浏览 5
提问于2020-04-24
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python Spark安装及配置步骤
Spark 2.4重磅发布:优化深度学习框架集成,提供更灵活的流式接收器
PySpark安装+Jupyter Notebook配置
PySpark,大数据处理的Python加速器!
pyspark 安装
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券