腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
如
何在
Spark
Structured Streaming
中
读取
Kafka
和查询外部存储,
如
Cassandra?
、
如
何在
Spark
Structured Streaming
中
读取
Kafka
和查询外部存储,
如
Cassandra?我
从
Kafka
获得消息
流
,我想对它应用Map操作,对于每个键,我想查询像Cassandra这样的数据存储,并获得该键的更多信息,并在流上应用进一步的操作。我如何
使用
Spark
Structured Streaming 2.2.0来做到这一点?
浏览 2
提问于2017-09-07
得票数 1
1
回答
结构化
流
如何动态解析
kafka
的
json
数据
、
、
我正在尝试
使用
结构化
流
从
Kafka
读取
数据。
从
kafka
收到的数据采用
json
格式。我的代码如下所示:在代码
中
,我
使用
from_
json
函数将
json
转换为dataframe以供进一步处理。",new StructType() . ) va
浏览 3
提问于2019-10-15
得票数 4
回答已采纳
1
回答
如
何在
Spark
中
使用
Java
从
kafka
中
读取
流
嵌套
JSON
、
、
我正在尝试
使用
Java
从
kafka
中
读取
复杂的
嵌套
JSON
数据,但在形成数据集时遇到了问题 发送给
kafka
的实际
JSON
文件 {"sample_title": {"txn_date": "2019-().format("
kafka
") .option("
spark</em
浏览 19
提问于2019-04-01
得票数 1
回答已采纳
5
回答
如何
从
Kafka
读取
XML格式的
流
数据?
、
、
、
我正在尝试
使用
Spark
结构化
流
从
Kafka
主题
读取
XML数据。df =
spark
\ .forma
浏览 19
提问于2017-09-01
得票数 6
回答已采纳
1
回答
Spark
Streaming with
Spark
2和
Kafka
2.1
、
、
、
我正在将一个
Java
项目
从
Cloudera 5.10升级到Cloudera 6.2。我们有
Spark
Streaming
从
Kafka
读取
数据来处理它并将结果写到其他地方。在升级过程
中
,
Spark
从
v1.6升级到v2.1,
Kafka
从
v0.8升级到v2.1。为了执行
流
处理,我们
使用
KafkaUtils.createStream(...)连接到
Kafka</e
浏览 11
提问于2021-09-27
得票数 0
1
回答
Spark
结构化流媒体,保存最新n条记录以备查询
、
我正在编写一个应用程序,将消息
从
Kafka
读取
到
Spark
使用
结构化
流
。SparkSession
spark
= createSparkSession(); Dataset<Row> df =
spark
浏览 2
提问于2017-08-22
得票数 1
1
回答
Kafka
Spark
-Streaming偏移问题
、
、
、
、
使用
Kafka
Spark
-Streaming。能够
读取
和处理生产者发来的数据。我在这里有一个场景,让我们假设生产者正在产生消息,而消费者被关闭了一段时间,然后打开了。现在,Conumser只
读取
实时数据。相反,它还应该保留它停止
读取
的数据。这是我一直在
使用
的pom.xml。行为与预期一致(消费者
从
数据离开的地方
读取
数据)。因此,在这个版本
中
,偏移量被正确地拾取。我也尝试过在上面的pom.xml中
使用</em
浏览 3
提问于2017-02-06
得票数 0
1
回答
如何
使用
avro模式
从
kafka
主题向apache注入数据?
、
、
我想了解apache如何处理具有AVRO模式的
Kafka
主题(模式包括
嵌套
对象、对象数组等)因为我没有找到任何资源或例子,说明我们如何
使用
带有avro模式的
Kafka
注入数据。根据我的理解,apache必须为
嵌套
的
Json
对象提供平面模式或其他选项,我们可以
使用
transform函数。有什么卡夫卡连接的皮诺做数据注入吗?] }} }
浏览 1
提问于2021-05-21
得票数 0
1
回答
在
Spark
结构的
流
中
读取
嵌套
Json
、
、
我正在尝试
使用
结构化流媒体
从
Kafka
中
读取
数据。
从
kafka
收到的数据为
json
格式。我
使用
样例
json
创建模式,稍后在代码中
使用
from_
json
函数将
json
转换为数据帧以进行进一步处理。我面临的问题是
嵌套
模式和多值。示例模式将标记(比如a)定义为结构。
从
kafka
读取
的
json
浏览 6
提问于2019-06-11
得票数 0
1
回答
Spark
3.x与Python
中
Kafka
的集成
、
、
、
、
带有火花
流
的
Kafka
抛出了一个错误:from pyspark.streaming.
kafka
import KafkaUtils ssc = StreamingCon
浏览 2
提问于2020-05-19
得票数 4
回答已采纳
3
回答
为什么不单独
使用
spark
-streaming
、
、
、
我没有太多
使用
Kafka
/
Spark
-Streaming的经验,但我读过很多关于组合在为分析/仪表板构建实时系统方面有多棒的文章。有人能给我解释一下为什么
spark
-streaming不能单独完成吗?换句话说,为什么
Kafka
在数据源和
spark
-streaming之间? 谢谢
浏览 1
提问于2016-01-11
得票数 1
1
回答
在
Java
语言中将模式添加到Dataset[Row]
、
我是
spark
的新手,正在尝试探索
Spark
结构化流媒体。我将
使用
来自
Kafka
(
嵌套
的
JSON
)的消息,根据
JSON
属性上的特定条件过滤这些消息。的文档 Dataset<Row> df =
spark
.format("
kafka
") .option("
kafka
.bootstrap.servers", "host1:
浏览 17
提问于2019-04-12
得票数 0
0
回答
Spark
Streaming
kafka
concurrentModificationException
、
、
、
我
使用
的是
Spark
流媒体应用程序。应用程序
使用
直接
流
从
Kafka
topic (具有200个分区)
中
读取
消息。:1431)at org.apache.
spark
.streaming.
kafka
010
Spark
浏览 1
提问于2017-12-03
得票数 2
回答已采纳
1
回答
火花结构化
流
检查点在生产中的
使用
、
、
、
、
当
使用
Spark
结构化
流
时,我难以理解检查点是如何工作的。 将已连接的DataFrame写入HBase表。
浏览 7
提问于2020-07-08
得票数 3
1
回答
如
何在
启动
Spark
流
处理时加载历史数据,并计算运行聚合
、
、
、
、
我在我的ElasticSearch集群中有一些与销售相关的
JSON
数据,我想
使用
Spark
(
使用
Spark
1.4.1)动态地通过
Kafka
从
我的eCommerce网站聚合即将到来的销售事件,以便对用户的总销售额
从
我所读到的文档
中
,我不太清楚的是,如
何在
Spark
应用程序启动时
从
ElasticSearch加载历史数据,并计算每个用户的总收入(基于历史记录,以及
从
<
浏览 2
提问于2015-07-27
得票数 3
回答已采纳
2
回答
Spark
Streaming -在多个
kafka
流上加入操作速度较慢
、
、
、
我有3个
kafka
流
,每个都有600k+记录,火花
流
需要超过10分钟来处理
流
之间的简单连接。
Spark
群集配置:这就是我在
spark
(scala)
中
读取
kafka
streams to tempviews的方法.format("
kafka
").option("endingOffsets", &
浏览 0
提问于2020-03-04
得票数 1
2
回答
获取
java
.lang.NoClassDefFoundError:
kafka
/序列化程序/StringDecoder异常
、
、
、
、
我正在尝试
读取
星火
流
应用程序
中
的
kafka
流
数据;而在
读取
数据的过程
中
,我得到了以下例外: at
java
.net.URLClassLoader.findClass(URLClassLoader.
java
:
浏览 0
提问于2016-12-24
得票数 0
2
回答
在
spark
结构化
流
中
写入来自
kafka
/
json
数据源的损坏数据
、
、
在
spark
批处理作业
中
,我通常会将
JSON
数据源写入到一个文件
中
,并且可以
使用
DataFrame阅读器的损坏列功能将损坏的数据写出到不同的位置,并
使用
另一个阅读器
从
同一作业
中
写入有效数据。(数据写为拼接) 但在
Spark
Structred Streaming
中
,我首先通过
kafka
将
流
作为字符串
读取
,然后
使用
from_
json</em
浏览 34
提问于2018-12-27
得票数 1
回答已采纳
1
回答
Hadoop可以做流媒体吗?
、
、
、
、
有人建议Hadoop做流媒体,并引用了Flume和
Kafka
作为例子。 虽然我知道它们可能具有流媒体功能,但我想知道它们是否可以与Storm/
Spark
/Flink等流处理技术并驾齐驱。
Kafka
是一个“发布-订阅模型消息传递系统”,而Flume是一个数据摄取工具。即使它们与hadoop交互/集成,从技术上讲,它们是“hadoop”本身的一部分吗?
浏览 4
提问于2018-04-07
得票数 0
4
回答
在
Kafka
上通过
JSON
消息在
Spark
Streaming
中
创建
Spark
DataFrame
、
、
、
我正在Scala
中
实现
Spark
Streaming,我
从
Kafka
主题中提取
JSON
字符串,并希望将它们加载到dataframe
中
。有没有一种方法可以让
Spark
自己
从
RDDString
中
推断出模式
浏览 0
提问于2015-06-26
得票数 9
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券