腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
未
显示
结构化
流式
处理
的
流式
处理
选项卡
、
、
、
、
我正在使用
结构化
流媒体来读取csvs和写入kafka。流
选项卡
未
显示
在Spark UI中(
未
使用流上下文)。
浏览 16
提问于2019-05-09
得票数 1
回答已采纳
1
回答
结构化
流式
处理
spark.sql.streaming.schemaInference不
处理
架构更改
、
checkpoint-location")启动
流式
查询后,如果在files-to-process目录下
的
新paruet文件上有模式更改。
未
写入新架构更改
的
结构化
流式
处理
。是否有可能在
结构化
流式
传输中
处理
浏览 2
提问于2021-07-09
得票数 0
1
回答
使用
结构化
流
处理
每个批次
的
记录
、
在遗留
的
spark流中,有一个度量标准,您可以看到该特定批
处理
正在
处理
多少条记录。有没有办法在spark structured streaming (3.x.x)指标中
显示
类似的东西? ?
浏览 14
提问于2021-07-23
得票数 0
1
回答
Spark Structured streaming UI
的
自定义
选项卡
、
、
我已经为Spark Structured streaming创建了一个Custom Streaming
选项卡
。我刚刚附加了Spark UI中
的
流式
选项卡
,但我无法附加在
流式
选项卡
中
的
页面。在这个自定义
选项卡
中,我想要
显示
已完成
的
批次数、每个批次收到
的
消息数、
处理
时间及其图表。SparkUI
未
调用SparkUITab
的
render方法。我得到<em
浏览 10
提问于2018-08-24
得票数 2
1
回答
将Spark SQL DataFrames转换为
结构化
流DataFrames
、
、
我想将Java Spark SQL DataFrames转换为
结构化
流式
DataFrames,这样每一批都会统一到
结构化
流式
DataFrame。因此,我可以在DataFrames上使用从批
处理
源获得
的
Spark Structured Streaming功能(例如连续作业)。
浏览 24
提问于2021-08-22
得票数 0
回答已采纳
1
回答
StreamingQueryException:‘描述Streams\n===流查询时出错
、
、
我在运行无法连接到Kinesis数据源
的
胶水
流式
作业时遇到以下错误:WARNING:root:StreamingQueryException caught.StreamingQueryException: 'Error while Describe Streams\n=== Streaming Query ===\nIdentifier: [id = 60exxxxxxxxxxxxxscala-library-2.11.12.jar, spark-sql_2.11-
浏览 0
提问于2020-09-08
得票数 0
1
回答
如何将spark
结构化
流数据写入REST API?
、
我想将我
的
spark
结构化
流式
处理
数据推送到REST API。有没有人可以分享一下相同
的
例子。我发现很少,但所有都与spark流媒体有关,而不是
结构化
流媒体。
浏览 14
提问于2019-01-18
得票数 1
1
回答
异常:不支持完整输出模式
、
、
我为我
的
教程创建了sparkStreaming模拟。当我执行outputMode ("complete")操作时,我得到一个错误。output mode not supported when there are no streaming aggregations on streaming DataFrames/Datasets; start.awaitTe
浏览 0
提问于2021-02-23
得票数 0
2
回答
[
结构化
流式
处理
]:
结构化
流式
处理
到红移接收器
、
、
有没有可能将Kafka流源支持
的
数据帧写入到AWS Redshift中,我们过去曾使用写入到Redshift中,但我认为它不会与DataFrame##writeStream一起工作。另外,考虑到Redshift
的
工作方式,使用JDBC connector和ForeachWriter进行编写可能也不是一个好主意。我在中遇到
的
一种可能
的
方法是将文件写入S3,然后使用具有S3对象路径
的
清单文件调用。在
结构化
流
的
情况下,我如何控制写入S3
的
文件?还有一个单独<
浏览 14
提问于2018-01-19
得票数 0
回答已采纳
1
回答
如何在zeppelin中自动更新
结构化
流查询
的
%spark.sql结果
、
、
、
我正在对来自kafka
的
数据运行
结构化
流式
处理
(spark 2.1.0 with zeppelin 0.7),并尝试使用spark.sql可视化
流式
处理
结果%spark2.queryName("test")运行后,我查询"test“,如下所示:select *它只在我手动运行时更新,我
的
问
浏览 4
提问于2017-07-13
得票数 6
2
回答
Spark
结构化
流式
处理
批
处理
、
我在Spark
的
结构化
编程中运行批
处理
。下面的代码片段抛出错误"kafka不是一个有效
的
Spark SQL数据源;“。我使用
的
版本是--> spark-sql-kafka-0-10_2.10。非常感谢您
的
帮助。谢谢。
浏览 0
提问于2017-05-24
得票数 1
1
回答
Spark结构流作业被卡住数小时而未被杀死
、
、
、
、
我有一个
结构化
的
流式
作业,从kafka读取,执行聚合和写入hdfs。该作业在yarn中以群集模式运行。我使用
的
是spark2.4。每隔2-3天,这项工作就会卡住。它不会失败,但会卡在某个微批
处理
中。当我终止
流式
作业并重新启动时,该作业再次开始正常运行。如何解决这个问题?
浏览 34
提问于2020-10-03
得票数 0
4
回答
对HDFS文件
的
一部分运行MR作业
假设您有一个大文件存储在hdtf中,其中包含
结构化
数据。现在
的
目标是只
处理
文件中
的
一部分数据,就像文件中第二列值介于so和so之间
的
所有行一样。是否可以启动MR作业,使hdfs仅
流式
传输文件
的
相关部分,而不是将所有内容
流式
传输到映射器。 原因是我想通过只
处理
我需要
的
部分来加快工作速度。
浏览 0
提问于2012-01-26
得票数 1
回答已采纳
1
回答
spark structured streaming和batch
的
接收器相同吗?
、
、
、
、
一个是批
处理
作业,另一个是
结构化
流式
作业。两者都写入相同
的
文件接收器。两者具有相同
的
架构。但是,当从该接收器读取数据时,spark仅读取由
流式
作业创建
的
文件,并跳过由批
处理
作业创建
的
文件。然而,这并不总是可能
的
,因为在下一个微批spark中将在那里创建另一个_spark_metadata文件夹。如何在spark中读取此接收器中
的
所有文件。
浏览 13
提问于2020-05-20
得票数 0
1
回答
流出大文件时冻结
使用fread()可以
流式
传输大文件来强制下载。但是,在
流式
传输期间,所有的php请求都将被阻塞,直到
流式
传输完成。如何在
流式
处理
过程中
处理
传入
的
requist?
浏览 0
提问于2015-02-10
得票数 3
1
回答
Spark Streaming with Spark 2和Kafka 2.1
、
、
、
我们有Spark Streaming从Kafka读取数据来
处理
它并将结果写到其他地方。在升级过程中,Spark从v1.6升级到v2.1,Kafka从v0.8升级到v2.1。为了执行流
处理
,我们使用KafkaUtils.createStream(...)连接到Kafka,但KafkaUtils在Kafka 2.11中不再可用。然而,我似乎找不到任何Spark Streaming + Kafka在Java中不使用此方法
的
示例或文档。 我是不是漏掉了什么?在这些版本中,连接两个世界
的
最佳方式是什么?
浏览 11
提问于2021-09-27
得票数 0
2
回答
结构化
流式
写入到不同
的
拼图文件夹
、
、
、
我正在使用spark structured streaming从kafka主题中读取事件,并对其进行
处理
并将其写入到parquet中。我必须根据我在事件中获得
的
键将输出写入不同
的
文件夹。我尝试使用
结构化
流式
处理
示例始终指向特定
的
文件夹.Do我需要为每个文件夹启动一个流吗?
浏览 2
提问于2018-08-13
得票数 0
1
回答
Zeppelin与Spark
结构化
流传输示例
、
、
我正在尝试在Zeppelin中可视化spark
结构化
的
流。我能够使用内存接收器()来实现。但对于大数据量来说,这并不是一个可靠
的
解决方案。什么是更好
的
解决方案? 示例实现或演示会很有帮助。
浏览 2
提问于2019-10-01
得票数 0
1
回答
BigQuery流丢失了流数据,但未报告错误
、
基本上,它
的
作用是。如果流成功,我将返回true,如果流失败,我将返回false。我发现bigquery流并不稳定。在我
的
测试中,大多数时候,我将所有的534845行都流到了表中。但有一次,我失去了一些行。例如,有
浏览 1
提问于2018-03-27
得票数 0
1
回答
在clearcanvas工作站中检索带有图像流
的
检查时需要帮助
、
我们需要帮助在工作站中检索带有图像流
的
研究。如何通过图像流从ClearCanvas服务器检索ClearCanvas工作站中
的
检查。
浏览 12
提问于2017-02-11
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券