腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(4281)
视频
沙龙
1
回答
Pyspark
Structred
Streaming
Parse
嵌套
Json
、
、
、
、
我的项目是,写
json
到Kafka主题,并从kafka主题读取
json
,最后下沉一个csv。一切都很好。但有些关键字是
嵌套
的
json
。如何解析
json
中的列表?示例
Json
: {"a": "test", "b": "1234", "c": "temp", "d": [{"test1": "car", "
浏览 14
提问于2020-01-12
得票数 0
1
回答
Spark
Structred
Streaming
Pyspark
Sink Csv不附加
、
、
、
、
向Kafka topic写入
json
,并从kafka Topic读取
json
。实际上,我是逐行订阅主题和编写控制台的。但我必须接收/写入文件csv。但是我不能。我只写了一次csv,但没有附加。import
pyspark
from
pyspark
.sql.types import * .load()\ df_query = df
浏览 23
提问于2020-01-11
得票数 1
回答已采纳
1
回答
使用
PySpark
统计每个窗口的用户数
、
、
、
、
我正在使用Kafka流式传输一个
JSON
文件,将每一行作为一条消息发送。其中一个关键字是用户的email。from
pyspark
import SparkContextfrom
pyspark
.
streaming
.kafkaimport KafkaUtils import <em
浏览 2
提问于2018-11-21
得票数 0
1
回答
如何将流数据从spark接收到Mongodb?
、
、
/
pyspark
/sql/
streaming
.py",行827,在start File "/home/b3ds/hdp/spark/python/lib/py4j-0.10.4-src.zip/py4jimport udffrom
pyspark
import SparkContext from
pyspark<
浏览 4
提问于2018-06-04
得票数 2
1
回答
只能在流式数据集/数据帧上调用Spark :writeStream
、
、
、
、
我正在尝试从我的Kafka集群中检索tweet到Spark
Streaming
,在Spark
Streaming
中我执行一些分析,将它们存储在ElasticSearch索引中。import osfrom
pyspark
.
stre
浏览 82
提问于2020-11-04
得票数 2
2
回答
无法使用spark
streaming
连接到kafka主题(python、jupyter)
、
、
、
下面是我的jupyter代码:os.environ['
PYSPARK
_SUBMIT_ARGS'] = '--packages org.apache.spark:spark-
streaming
-kafka-0-8_2.11:2.0.2
pyspark
-shell'from
pyspark
import SparkContext from
pyspark
.
streaming
im
浏览 0
提问于2019-12-19
得票数 1
1
回答
如何使用
Pyspark
从Azure eventhub中流式传输数据?
、
、
、
、
我可以使用另一个python脚本从事件中心获取消息,但不能使用
Pyspark
流式传输消息。下面是我用来流式传输消息的
Pyspark
代码: connectionString = <MyConnectionString> 'eventhubs.connectionStringoptions(**ehConf).load() df.writeStream.format("parquet").outputMode("append").option("path&quo
浏览 42
提问于2019-12-04
得票数 0
1
回答
卡夫卡的电火花印刷信息
、
、
、
我建立了一个由生产者和消费者组成的kafka系统,将
json
文件的行作为消息流。from
pyspark
.sql import SQLContext, Row .setAppName("<e
浏览 0
提问于2018-11-18
得票数 1
回答已采纳
1
回答
执行Spark
streaming
从Kafka主题读取数据时出错
、
、
、
spark-submit --packages org.apache.spark:spark-
streaming
-kafka-0-8_2.11:2.4.7
Streaming
Example.pyfrom
pyspark
import SparkContextfrom
pyspark
.
streaming
importStreamingContext from
pyspark
.
st
浏览 15
提问于2021-05-27
得票数 0
1
回答
Jupyter Notebook: Sparks的printt()函数不打印
、
、
、
、
我将遵循本教程:Getting Started with Spark
Streaming
with Python and Kafka 我正在将代码复制到我的Jupiter Notebook (Python完整的代码: #1os.environ['
PYSPARK
_SUBMIT_ARGS'] = '--packages org.apache.spark:spark-
streaming
-kafka-0-8_2.11:2.0.2
pyspark
-shell' f
浏览 36
提问于2019-05-16
得票数 0
回答已采纳
1
回答
spark流式传输到
pyspark
json
文件中的数据帧
、
、
、
我正在从kafka流式传输
json
数据,我需要转换为
pyspark
中的Dataframe。为了流媒体,我使用了下面的代码。from __future__ import print_functionimport csvfrom
pyspark
import SparkContextfrom
pyspark
.
streaming
import StreamingContext from
pyspark
.
streamin
浏览 3
提问于2017-07-30
得票数 0
1
回答
如何使用Kafka格式化Azure Eventhub的
pyspark
连接字符串
、
、
、
我正在尝试从一个启用了Kafka兼容性的Azure Eventhub中使用
Pyspark
解析
JSON
消息。我找不到任何有关如何建立连接的文档。import osfrom
pyspark
.
streaming
import StreamingContextimport
json
sc.stop(
浏览 9
提问于2019-08-19
得票数 0
回答已采纳
1
回答
如何正确使用
pyspark
向kafka broker发送数据?
、
、
、
我正在尝试编写一个简单的
pyspark
作业,它将从kafka broker主题接收数据,对这些数据进行一些转换,并将转换后的数据放在不同的kafka broker主题上。我有以下代码,它从kafka主题读取数据,但在运行sendkafka函数时没有任何效果:import sysfrom <e
浏览 4
提问于2016-05-20
得票数 8
回答已采纳
1
回答
如何正确地向Google提交kafka流吡源作业
、
、
、
我正试图通过Dataproc提交一个
pyspark
作业,并不断得到一个错误,看起来它没有加载kafka流包。"jobId": "job-33ab811a" }, "pysparkJob": { "mainPythonFileUri": "gs://projectname/
streaming
.pyorg.apache.spark:spark-sql-kafka-0-10_2.11:2.2.0"
浏览 0
提问于2018-03-11
得票数 0
回答已采纳
1
回答
火花流与
json
文件
、
我想通过火花流从文件夹位置读取
json
数据。我假设我的
json
数据是我希望Spark表中的输出为:--import org.apache.spark.
streaming
.{Spark
浏览 4
提问于2017-07-22
得票数 2
1
回答
Spark
Streaming
App无法接收来自Kafka的消息
、
、
、
from kafka import KafkaProduceruserdata={from __future__ import print_functionimport sys impor
浏览 9
提问于2017-08-28
得票数 0
回答已采纳
2
回答
OSError:[Errno 22]火花流
PySpark
中的参数无效
、
、
from
pyspark
.sql import SparkSessionfrom
pyspark
.
streaming
importStreamingContextimport
json
sc = SparkContext('local/
pyspark
/
浏览 37
提问于2019-12-16
得票数 0
1
回答
解析
JSON
数据并在
PySpark
中保存到
PySpark
中
、
、
、
、
下面的代码帮助我做到这一点:import sysfrom
pyspark
.sql.types import *from
pyspark
.
streaming
import StreamingContext from
pyspark
.
streaming
.kafka import,它说它需要DataFrame存储在Mo
浏览 2
提问于2018-02-22
得票数 1
2
回答
pyspark
streaming
DStreams to kafka主题
、
、
、
在
pyspark
中可以做到这一点吗?
浏览 1
提问于2018-06-08
得票数 0
2
回答
使用
pyspark
解析
json
流
、
、
、
我是Spark
Streaming
的新手,我正在尝试使用
pyspark
读取和解析来自Kafka的
JSON
流。读取流是可以的,而且我也可以pprint() RDDs。,"WattsLimit":"-1"}但我不知道如何对它们使用
json
.loads()。我的python代码是: i
浏览 3
提问于2016-03-04
得票数 1
点击加载更多
相关
资讯
你所不知道的JSON.parse和JSON.stringify高级用法
类型转换革命:用Hutool代码替代传统Java代码,省下80%的开发时间!
遇到JSON文件就头大?掌握Python这几种方法,让你轻松应对!
精通 Node 爬虫-03-知乎专栏爬虫实战
写给小白的JSON完全指南:5分钟理解AI和开发者都在用的数据格式
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
对象存储
活动推荐
运营活动
广告
关闭
领券