腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
火花结构化
流
避免延迟和检查点: startingOffsets最新版本不工作吗?
scala
、
apache-spark
、
apache-kafka
、
spark-structured-streaming
(分钟)似乎火花结构化
流
并没有很好地使用startingOffsets属性的最新。我不想读旧消息,只有重要的当前的!
浏览 3
提问于2021-10-01
得票数 1
3
回答
当使用Spark结构化
流
时,如何才能获得当前批处理的聚合结果,如Spark
流
?
apache-spark
、
spark-streaming
、
spark-structured-streaming
星火结构
流
( SSS )和星火
流
(SS)的一个很大的区别是SSS可以利用状态。它可以存储以前
批
的聚合结果,并将当前结果与先前的结果一起应用。因此,它可以从输入流的一开始就得到真正的聚合结果。在平台和
框架
方面,我们不能回到党卫军。以word计数应用为例,在火花结构
流
指南:中给出了该应用程序。当有一个"cat cat“在一个
批
,我的预期输出是cat|2。 当下一
批
浏览 0
提问于2018-01-23
得票数 3
回答已采纳
2
回答
外部批处理的火花访问数据帧(结构化
流
)
apache-spark
我想要在火花
流
的foreach批处理中创建和更新一个数据帧,并在下面的foreach批处理迭代器之外访问它,这就是我在火花结构化
流
中试图做的事情。是否可以从外部访问为火花结构化
流
中的每一
批
创建或更新的数据帧?= None) {} 我甚至不能访问临时表,这些表是从外部为每个
批
创建的。即使是在foreach
批
内更新的数据
框架
也显示来自外部foreach<em
浏览 1
提问于2021-03-25
得票数 0
回答已采纳
4
回答
有哪些编程语言是用于机电
一体
化的?
programming-languages
、
robotics
有没有专为机电
一体
化编程而设计的语言?我知道LabView,这是一种数据
流
语言,但不确定它的主要平台。 除了c/c++之外,你能向我推荐一些语言吗?用于机电
一体
化(机器人、传感器编程等)主题的任何语言。
浏览 0
提问于2012-11-27
得票数 1
回答已采纳
1
回答
从批处理顺序Mule ESB调用
流
mule
、
batch-processing
、
mule-component
我创建了一个批处理
流
。从一
批
流
,我调用另一
批
,从第二
批
,我调用简单的第三
流
。我需要第三次流动的选择应该是完整的,然后,只有2条记录应
浏览 1
提问于2017-04-05
得票数 1
1
回答
风暴式间歇加工
apache-kafka
、
apache-storm
、
trident
我对风暴的用例是
流
处理和批处理。用例2:风暴拓扑应该将元组作为一
批
元组进行处理。 我使用Kafka作为队列机制来提供Storm拓扑。是否Storm不是这样做的正确
框架
,因为它是用于
流
处理的(用例1)。风暴三叉戟对用例#2有帮助吗?
浏览 3
提问于2015-09-22
得票数 0
3
回答
我需要下载什么才能开始使用Spring
框架
开发应用程序?
java
、
spring
我需要开始使用Spring
框架
开发应用程序,我想知道我需要下载哪些工具来启动和运行我。 弹簧JavaConfig
浏览 3
提问于2009-05-05
得票数 2
回答已采纳
1
回答
存在一种配置蛋糕的方法,因此它在DotNetCorePublishSettings内部使用自包含的交换机。
c#
、
.net
、
cakebuild
MSBuild有一个“--自成
一体
”的开关,它也发布了使用过的.NET
框架
。所以蛋糕有一个函数"DotNetCorePublish“。是否存在设置该函数的方法,以便它也提供
框架
?
浏览 10
提问于2021-11-26
得票数 0
回答已采纳
1
回答
tensorflow验证监视器
流
auc
python
、
tensorflow
在tensorflow验证监视器
流
auc中,它对流意味着什么?案例1:每次调用验证监视器时,都会重置auc状态,因为在每个验证步骤中,对10个
批
进行
流
处理。案例2: auc状态没有重置,因此
流
auc是从验证监视器的第一次调用中计算出来的。即,第一输出( 100步)从10
批
计算,第二验证输出( 200步骤)基于第
浏览 5
提问于2017-06-09
得票数 1
回答已采纳
1
回答
在批处理执行AWS Kinesis之前设置超时延迟
aws-lambda
、
serverless-framework
、
amazon-kinesis
我正在使用AWS (配置为Serverless
框架
),我使用的是batchSize of 1。 handler: ...kinesis arn:例如,在读取下一
批
之前我希望在每个lambda执行之前有一个时间延迟,基本上从
流
中提取一个记录。 谢谢!
浏览 1
提问于2020-02-05
得票数 1
0
回答
Spark RDD apend
apache-spark
在Spark中,我以RDD的形式加载了一个数据集,并且喜欢不频繁地向其追加
流
数据。我知道RDDs是不可变的,因为它简化了锁定,等等。其他处理静态和
流
数据的方法是
一体
的吗? 类似的问题以前也被问过:
浏览 7
提问于2016-12-24
得票数 0
1
回答
星火结构
流
-动态更新数据帧的模式
apache-spark
、
apache-spark-sql
、
schema
、
spark-structured-streaming
我有一个简单的结构化
流
作业,它监视CSV文件的目录,并编写拼花文件--在两者之间没有转换。这项工作从使用readStream()读取CSV文件开始构建一个数据
框架
,我通过调用一个名为buildSchema()的函数获得了一个模式。虽然buildSchema()可以为我提供最新的模式,但我不知道如何定期调用它(或者每个CSV文件一次),然后使用最新的模式以某种方式重新生成或修改数据
框架
。在测试时,我观察到只有query对象在一
批
接一
批
地连续运行;我放置的log语句和用于模式比较的if()语句只在应用程序开始
浏览 2
提问于2018-02-12
得票数 11
1
回答
将火花流连接到
流
集输入
streaming
、
spark-streaming
、
streamsets
我想知道是否有可能提供输入来激发来自StreamSets的
流
。我注意到在StreamSets连接器目的地中不支持火花
流
。 我将探讨是否有其他方法将它们连接到一个示例POC。
浏览 3
提问于2016-07-06
得票数 3
回答已采纳
1
回答
是否有一个变量来识别火花
流
中的每一
批
数据?
apache-spark
、
spark-streaming
在火花
流
中,数据按
批
间隔进行处理。is first batch of data10s~15s is third batch of data是否有一个变量来识别火花
流
中的每一
批
数据如果有这样的变量:我可以获得batchID的值来识别哪一
批
数据,也可以通过batchID (如:window(……).filter(_.batchId == 1) )过滤数据或者有什么方法来区分每一
批
数据?
浏览 6
提问于2016-02-02
得票数 3
回答已采纳
1
回答
具有周期性更新静态数据集的结构化
流
scala
、
apache-spark
、
spark-structured-streaming
流
和静态数据集的合并是结构化
流
的一个很好的特点。但是每一
批
数据集都会从数据源中刷新。由于这些源并不总是动态的,因此在指定的时间段(或
批
数)缓存静态数据集将是一种性能增益。在指定的批处理期间/
批
数之后,数据集将从源重新加载,否则将从缓存中检索。 在星火
流
中,我使用缓存的数据集来管理它,并在指定数量的批处理运行后取消它的持久化,但是由于某种原因,这不再适用于结构化
流
。
浏览 1
提问于2017-12-13
得票数 9
2
回答
星火
流
和星火结构化
流
使用相同的微
批
引擎吗?
apache-spark
、
spark-streaming
、
spark-structured-streaming
星火
流
和星火结构化
流
是否使用相同的微
批
调度引擎?星火结构
流
比星火
流
有更低的延迟吗?
浏览 0
提问于2019-02-01
得票数 3
回答已采纳
1
回答
PyFlink性能与Scala的比较
pyspark
、
apache-flink
、
spark-streaming
、
pyflink
冷(
批
)层将用Apache (PySpark)实现。但是对于热(
流
)层有不同的选择:火花
流
或Flink。提前谢谢你!
浏览 3
提问于2021-11-05
得票数 1
回答已采纳
1
回答
如何在其中一个作业失败时关闭/杀死火花
流
应用程序
apache-spark
、
spark-streaming
我正在运行一个星火
流
应用程序。有几次,其中一个作业由于某些运行时异常而失败。streaming将作业标记为失败,并继续处理下一个
流
批
。如果其中一个作业失败,是否有一个参数可以设置为通知Spark关闭应用程序(而不是处理下一个
流
批
)?我在独立集群模式上使用Spark1.4.1。
浏览 0
提问于2016-06-10
得票数 0
1
回答
openshift上的批处理作业
openshift
、
spring-batch
、
spring-cloud-dataflow
、
spring-cloud-task
我们必须使用Java在OpenShift环境下决定批处理
框架
/技术。目前,我们正在使用springboot的在线应用程序。对于批处理,我们有以下选项, 还有一件事是,我们应该有监控UI/System/tool,为了知道处理的状态,它失败了,我应该能够从监视ui重新运行btach
浏览 0
提问于2019-09-12
得票数 0
1
回答
使用Spring云
流
Kafka Binder在批处理功能中发布多条消息
apache-kafka
、
spring-cloud-stream
、
spring-cloud-stream-binder-kafka
我正在寻找一个示例来创建一个使用spring云
流
kafka绑定器(没有Kafka
流
)的功能风格处理器,它可以从一个主题消耗一
批
n条消息,并将m条消息发布到另一个主题(m < n)。
浏览 6
提问于2021-05-25
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
即时通信 IM
活动推荐
运营活动
广告
关闭
领券