腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(2799)
视频
沙龙
1
回答
如何
使用
Spark
streaming将数据从Kafka插入到Kudu
、
、
、
我有一个可以收听Kafka主题
的
Spark
流媒体
应用程序。当获得数据时,我需要对其进行处理,并将其发送到Kudu。目前,我正在
使用
org.apache.kudu.
spark
.kudu.KuduContext API,并对数据框调用插入操作。为了从我
的
数据创建数据框,我需要调用collect(),以便可以
使用
sqlContext创建数据框。 有没有一种方法可以在不调用collect()
的
情况下创建数据帧/将数据插入到Kudu中?我们
使用
浏览 7
提问于2018-08-08
得票数 1
1
回答
如何处理JSON文档(来自MongoDB)并在
结构化
流中写入
HBase
?
、
、
、
我正在获取mongoDB文档,然后在处理之后,我想
使用
Bson.Document库将其存储到
Hbase
中在
结构化
流媒体
中,我得到了DatasetDocument scala> val stream =
spark
.readStream.forma
浏览 15
提问于2019-11-09
得票数 2
1
回答
Spark
流媒体
与
结构化
流媒体
、
、
在过去
的
几个月里,我
使用
了相当多
的
结构化
流媒体
来实现Stream Jobs (在
使用
了很多Kafka之后)。在阅读了“
使用
Apache
Spark
进行流处理”一书后,我有了这样一个问题:有没有什么要点或用例可以让我
使用
Spark
流而不是
结构化
流?我是不是应该花点时间去了解它,或者既然我已经在
使用
Spark
Structured Streaming了,我应该坚持<e
浏览 17
提问于2020-04-06
得票数 2
2
回答
是否可以直接将数据从Nifi发送到
Spark
结构化
流/Storm,而不丢失数据?
、
、
、
在我当前
的
场景中,Nifi收集数据,然后发送给Kafka。然后,任何
流媒体
引擎都会消耗卡夫卡
的
数据,并对其进行分析。在这种情况下,我不想在Nifi和
流媒体
引擎之间
使用
卡夫卡。例如,
结构化
流;如果我直接将数据从Nifi发送到
Spark
结构化
流,
Spark
收到了这些数据,但是
Spark
的
节点被关闭了。火花节点中
的
数据会发生什么变化?(
Spark
结构化</em
浏览 0
提问于2019-02-14
得票数 0
回答已采纳
1
回答
使用
HBase
接收器
的
Spark
结构化
流媒体
、
、
我
的
用例是
使用
结构化
流读取Kafka消息,并
使用
foreachBatch通过
使用
一些批量Put将这些消息推送到
HBase
中。为了获得比单个Put更高
的
性能,我可以
使用
foreach推送消息(感谢
Spark
Structured Streaming with
Hbase
integration),但不能对foreachBatch操作执行同样
的
操作。import org.apache.hadoop.<e
浏览 19
提问于2020-07-02
得票数 0
1
回答
用谷歌PubSub实现Apache
Spark
的
结构化
流媒体
、
、
我正在
使用
Spark
Dstream从谷歌PubSub中提取和处理数据。 我正在寻找一种方法来转移到
结构化
流媒体
,但仍然
使用
发布/订阅。 另外,我应该提一下,我
的
消息在Pub/Sub中压缩得很快。我发现了this问题,它声称不支持
使用
带有
结构化
流
的
发布/订阅。 是不是有人遇到过这个问题?是否可以实现自定义
接收器
以从发布/订阅中读取数据 谢谢
浏览 34
提问于2019-05-03
得票数 2
回答已采纳
1
回答
查找关于火花DStream到镶嵌面板文件
的
性能提示
、
、
我想将Elasticsearch索引存储到HDFS文件中,而不是
使用
ES-Hadoop连接器。建议
的
解决方案是
使用
流式定制
接收器
读取并保存为拼图文件,并且代码如下所示, JavaDStream<String> jsonDocs = ssc.union(dsList.get(0), dsList.subList().json(
spark
.createDataset(rdd.rdd(), Encoders.STRING())); ds.write().mode(SaveMode.Appen
浏览 28
提问于2019-04-02
得票数 1
2
回答
Spark
Structured Kafka偏移管理
、
、
、
我正在研究在kafka中存储kafka偏移量用于
Spark
结构化
流媒体
,就像它对DStreams stream.asInstanceOf[CanCommitOffsets].commitAsync(offsetRanges)一样,与我正在寻找
的
相同,但用于
结构化
流媒体
。它是否支持
结构化
流媒体
?如果是,我如何实现它?我知道
使用
.option("checkpointLocation", checkpointLocati
浏览 10
提问于2019-05-16
得票数 3
1
回答
如何将
spark
结构化
流数据写入REST API?
、
我想将我
的
spark
结构化
流式处理数据推送到REST API。有没有人可以分享一下相同
的
例子。我发现很少,但所有都与
spark
流媒体
有关,而不是
结构化
流媒体
。
浏览 14
提问于2019-01-18
得票数 1
2
回答
5分钟
Spark
批处理作业与流作业
、
我正在试着找出什么是更好
的
方法。 我有一个火花批处理作业,这是计划运行每5分钟,它需要2-3分钟来执行。由于已经添加了对动态分配
spark
.streaming.dynamicAllocation.enabled
的
支持,将其设置为每5分钟从源拉取数据
的
流式作业是一个好主意吗?
浏览 0
提问于2019-07-24
得票数 0
1
回答
从
Spark
2.2到2.3
的
结构化
流媒体
有什么不同?
我在
Spark
2.3
的
发布说明中看到了
结构化
流媒体
的
公告/揭幕,但我知道它已经存在了一段时间了。由于一些依赖,我需要在系统实现中
使用
Spark
2.2,但我也想开始将面向批处理
的
工作转移到流范例中。在没有
Spark
2.3
的
过程中,我是否遗漏了什么重要
的
东西,或者这仅仅是
结构化
流媒体
成为“官方”而不是实验性
的
发行版?
浏览 13
提问于2018-07-25
得票数 0
3
回答
HBASE
火花与HDFS火花
、
、
、
我知道
HBASE
是一个柱状数据库,它将表
的
结构化
数据按列而不是按行存储到HDFS中。我知道
Spark
可以从HDFS读/写,还有一些用于
Spark
的
HBASE
连接器现在也可以读写
HBASE
表。问题: 1)在
HBASE
之上分层火花而不是单独
使用
HBASE
所带来
的
附加功能是什么?它只取决于程序员
的
能力,或者有任何性能原因来这样做?是否有星火所能做
的</
浏览 4
提问于2016-08-13
得票数 9
回答已采纳
1
回答
Spark
结构化
流媒体
中
的
滞后函数
、
我正在
使用
Spark
2.3
结构化
流媒体
,并尝试
使用
“lag”功能。但是,看起来在
结构化
流中不支持lag。val output =
spark
.sql("SELECT temperature, time, lag(temperature, 1) OVER (ORDER BY time) AS PrevTempFROM InputTable")org.apache.
spark
.sql.AnalysisException
浏览 13
提问于2018-07-21
得票数 2
1
回答
如何通过
spark
结构流在Kafka中以编程方式创建主题
、
、
我想在我
的
Spark
结构化
流媒体
应用程序中创建多个kafka主题运行时。我发现Java API中有各种可用
的
方法。但我找不到任何有
Spark
结构
的
流媒体
。如果有什么方法可以
使用
或者我需要
使用
java库,请告诉我。 我
的
apache
Spark
版本是2.4.4,Kafka库依赖是
spark
-sql-kafka-0-10_2.12
浏览 17
提问于2019-11-28
得票数 0
1
回答
在
Spark
2.1
的
Spark
-kafka集成中,有多少个执行者被指派去听一个kafka话题?
、
、
我有一个
Spark
集群,总共有17个executors。我已经将
Spark
2.1与Kafka集成在一起,并从topic中读取数据,例如: .readStream .options(kafka.bootstrap.servers","localhost:9092") .load 现在我想知道,当我以集群模式提交
浏览 0
提问于2018-09-05
得票数 2
2
回答
如何对
Spark
结构化
流媒体
进行单元测试?
、
、
我想了解一下
Spark
Structured Streaming
的
单元测试方面。我
的
场景是,我从Kafka获取数据,并
使用
Spark
Structured Streaming
使用
它,并在数据上应用一些转换。 我不确定如何
使用
Scala和
Spark
来测试它。有人能告诉我如何
使用
Scala在
结构化
流媒体
中进行单元测试吗?我还是个
流媒体
新手。
浏览 3
提问于2019-07-05
得票数 2
1
回答
Kappa体系结构:当插入到批/分析服务层时
、
、
、
、
如您所知,Kappa架构是Lambda体系结构
的
某种简化。Kappa不需要批处理层,而是速度层必须保证历史数据重计算
的
计算精度和足够
的
吞吐量(更多
的
并行性/资源)。例如,年龄<2周
的
数据存储在Redis (流服务层),而所有旧数据存储在
HBase
(批处理服务层)
的
某个地方。 什么时候(由于Kappa架构)我必须插入数据到批处理服务层?例如:假设数据
的
来源是Kafka,数据是由
Spark
结构化
流或Fl
浏览 7
提问于2019-10-15
得票数 7
回答已采纳
1
回答
如何在
Spark
Streaming 2.3.1中将每条记录写入多个kafka主题?
、
、
如何在
Spark
Streaming 2.3.1中将每条记录写入多个kafka主题?换句话说,我有5条记录和两个输出kafka主题,我希望在两个输出主题中都有5条记录。问题没有谈到
结构化
的
流媒体
案例。我正在寻找
结构化
流媒体
的
具体。
浏览 16
提问于2018-07-23
得票数 1
1
回答
Spark
Streaming xml文件
、
、
首先,
使用
Spark
的
fileStream读取文件对Dataframe进行一些处理并另存为JSON loaddata.write.mode有没有更好<
浏览 0
提问于2016-11-18
得票数 2
3
回答
Pyspark
结构化
流Kafka配置错误
、
、
、
、
我之前已经成功地
使用
了pyspark for
Spark
Streaming (
Spark
2.0.2)和Kafka (0.10.1.0),但我
的
目的更适合于
结构化
流媒体
。我尝试在线
使用
示例:ds1 =
spark
.format("kafka").option("p
浏览 2
提问于2017-07-07
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark 2.4重磅发布:优化深度学习框架集成,提供更灵活的流式接收器
spark streaming的使用心得
一文读懂Apache Spark
Spark 核心编程RDD的使用(1)
大数据初学者怎样学习 或Java工程师怎么转大数据?
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券