腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
PyFlink性能与Scala
的
比较
pyspark
、
apache-flink
、
spark-streaming
、
pyflink
如何将PyFlink性能与
Flink
+ Scala进行比较?因此,Apache是纯
流
的
,而不是Spark
的
微
批
,我倾向于选择Apache。但我唯一关心
的
是PyFlink
的
性能。PySpa
浏览 3
提问于2021-11-05
得票数 1
回答已采纳
1
回答
当
流
不重要时
apache-spark
、
apache-flink
最近,我一直在比较火花和
Flink
的
一个全新
的
项目。在这个项目中,
流
功能不是那么重要。对~(90) is数据进行批量分析是最重要
的
。稍后,我将在数据分析中应用ML和数据挖掘。在搜索时,我发现很多文章,演示和视频声称
Flink
是下一代
的
分析解决方案。没有多少文章能为火花辩护。另一方面,星火是(或曾经?)非常流行,并广泛部署在非常大
的
生产系统。我
的
问题是:对于我
的
用例来说,
流
并不重要,我是拥抱
F
浏览 5
提问于2017-05-19
得票数 3
回答已采纳
1
回答
风暴式间歇加工
apache-kafka
、
apache-storm
、
trident
我是风暴
的
新手,几乎没有什么基本问题。我对风暴
的
用例是
流
处理和批处理。用例2:风暴拓扑应该将元组作为一
批
元组进行处理。问:有没有办法,我可以说,一个特定
的
元组是结束
的
溪流和风暴应该告诉我什么时候处理完所有的元组? 是否Storm不是这样做
的
正确框架,因为它是用于
流
处理
的
(用例1)。风暴三叉戟对用例#2有帮助吗?
浏览 3
提问于2015-09-22
得票数 0
1
回答
如何保留apache
flink
任务并在重启jobmanager时提交记录
apache-flink
我正在使用apache
flink
1.10
批
量计算我
的
流
数据,今天我将我
的
apache
flink
kubernetes(v1.15.2) pod从机器1移动到机器2,发现所有提交任务记录和任务列表都消失了重启apache
flink
的
kubernetes pod时,如何保存提交记录和任务列表?我只发现checkpoint persistant,但没有关于任务
的
。如果丢失了正在运行
的
任务历史,我必须上传我
的
浏览 4
提问于2020-04-30
得票数 0
1
回答
Flink
卡夫卡
流
相对于星火卡夫卡
流
的
好处?卡夫卡流过弗林克?
apache-kafka
、
spark-streaming
、
apache-storm
、
apache-flink
、
apache-kafka-streams
在火花
流
中,我们设置了几乎实时
的
微批处理
的
批处理间隔。在
Flink
(DataStream)或Storm中,
流
是实时
的
,所以我想没有这样
的
批处理间隔
的
概念。在卡夫卡,消费者在拉,我想象星火使用
批
参数从卡夫卡经纪人提取消息,那么
Flink
和Storm是如何做到
的
呢?我设想
Flink
和Storm在一个快速循环中拉出Kafka消息形成实时
流
源,如果是这样的话,如果我将火
浏览 5
提问于2016-10-24
得票数 7
回答已采纳
1
回答
Flink
中
的
低延迟
流
与多个元数据
流
的
结合(丰富)
apache-flink
、
flink-streaming
我正在为
流
分析方案评估
Flink
,并且还没有找到关于如何实现我们今天在遗留系统中所做
的
一种ETL设置
的
足够信息。一个非常常见
的
场景是,我们使用了
关键
的
、慢吞吐量
的
元数据
流
,我们希望使用这些数据流在高吞吐量数据流上进行丰富,如下所示:这就引出了两个关于
Flink
的
问题:如何通过缓慢更新时间窗口重叠但不相等
的
流来丰富快速移动
的
流
如何有效地
浏览 3
提问于2017-11-21
得票数 1
回答已采纳
1
回答
在
Flink
中有多个工作人员
的
全局状态可能吗?
apache-flink
在
Flink
文档中
的
任何地方,我都看到状态是映射函数和工作人员
的
独立状态。在独立
的
方法中,这似乎是强大
的
,但是如果
Flink
在集群中运行呢?
Flink
能否处理所有工作人员都可以添加数据并查询数据
的
全局状态? 为了在此设置中实现高吞吐量和低延迟,必须尽量减少任务之间
的
网络通信。在
Flink
中,
流
处理
的
网络通信只
浏览 0
提问于2018-01-31
得票数 5
1
回答
Apache
Flink
存储
apache-flink
在处理了这数百万
的
事件/数据之后,哪里是保存信息
的
最佳地方?我看到一个关闭
的
提到了Parquet格式,但是,默认
的
是HDFS吗?我关心
的
是储蓄后(哪里?)如果它是容易
的
(快!)才能检索到数据?
浏览 3
提问于2015-08-11
得票数 5
2
回答
什么意味着“广播状态”为
Flink
的
CEP库
的
“动态模式”特性
的
实现打开了障碍?
apache-flink
、
flink-streaming
、
flink-cep
从
Flink
1.5发布公告中,我们知道
Flink
现在支持“广播状态”,并描述了“广播状态为
Flink
的
CEP库
的
”动态模式“特性
的
实现打开了障碍。”这是否意味着目前我们可以使用“广播状态”来实现“动态模式”而不需要
Flink
CEP?另外,我不知道在有或没有广播状态
的
情况下实现
Flink
CEP
的
“动态模式”有什么区别?============= 测试广播数据
流
的
更新.使用键控-
浏览 1
提问于2018-05-26
得票数 0
回答已采纳
2
回答
我怎么知道我已经吃掉了所有的卡夫卡话题?
apache-kafka
、
apache-flink
我使用
的
是
Flink
v1.4.0。我使用如下代码所示
的
Kafka
FLink
Consumer来使用Kafka主题中
的
数据:properties.setProperty(这是否足以确认我已经使用了Kafka主题中
的
所有数据?)
浏览 6
提问于2018-01-25
得票数 3
回答已采纳
1
回答
流
处理和批处理
apache-spark
、
stream
、
apache-flink
、
processing
、
pipeline
由于批处理
的
延迟是在累积特定数目的数据时产生
的
,我是否可以将“一
的
大小”
的
批处理视为
流
处理?或者当运算符进行计算时还有其他
的
区别吗?例如,如果我将基于火花
的
程序
的
批处理大小设置为1,是否可以使其延迟降低到
flink
?我
的
一种想法是:对于
流
处理,如果处理了前一个操作符,一个数据
流
就会从前一个操作符流到后一个操作符,但是对于批处理过程,只有在操作符处理完一个数据之后,它才能接受另一个数
浏览 9
提问于2022-11-14
得票数 0
1
回答
用动态限制
Flink
中
的
网络流量
apache-flink
、
flink-streaming
、
amazon-kinesis
、
amazon-kinesis-analytics
我在Amazon
的
服务(托管
Flink
集群)中运行了一个
Flink
应用程序。在这个应用程序中,我从一个名为keyBy userId
的
动态
流
中读取用户数据,然后聚合一些用户信息。在询问之后,我了解到
Flink
将在集群中
的
物理主机上拆分流
的
读取。
Flink
然后将传入
的
事件转发给将聚合器任务分配给对应于给定事件
的
键空间
的
主机。考虑到这一点,我正试图决定如何使用什么作为我
的</em
浏览 4
提问于2020-02-18
得票数 0
回答已采纳
1
回答
基于Kubernetes
的
Apache部署-可用性和可伸缩性
kubernetes
、
apache-flink
、
flink-streaming
我希望使用同样
的
方法来部署我
的
一些
Flink
作业。
Flink
作业是
关键
的
-有些作业是无状态
的
,它们处理每一个数据(准确地说是一次),有些作业是有状态
的
,可以在
流
中查找模式或对时间作出反应。没有作业能够容忍长时间
的
停机或频繁
的
关闭(因为编程错误,
Flink
退出
的
方式)。 我发现文档大多倾向于将k8s中
的
Flink
作业部署为Job
浏览 0
提问于2020-02-13
得票数 3
1
回答
Flink
流
,“sum”到底是做什么
的
?
java
、
apache-flink
、
flink-streaming
我很难理解
流
,以工作计数为例,对于卡夫卡这样
的
无限源,“和”到底是做什么
的
?returns(Types.TUPLE(Types.STRING, Types.LONG)) .sum(1); 开始时间和结束时间是多少?当第三次
Flink
收到单词“foo”时,“sum”
浏览 1
提问于2019-03-06
得票数 0
回答已采纳
1
回答
非法
的
反射访问操作会阻止程序运行吗?
java
、
apache-flink
我正在从事一个项目使用java和
flink
来建立一个推文数据
流
。(file:/home/haydn/.m2/repository/org/apache/
flink
/
flink
-core/1.4.2/
flink
-core-1.4.2.jar) to field java.nio.Buffer.addressaccess operations WARNING: All illegal access operat
浏览 237
提问于2018-06-08
得票数 1
1
回答
减少并加入窗口
apache-flink
我要把两个
关键
的
溪流连接到一个窗口上。但是,我需要首先减少这两个
流
,然后在聚合上应用连接,所有这些都在同一个窗口中。我花了一段时间研究
Flink
API,发现这样
的
应用函数存在于WindowedStream中。问:这会对
Flink
有帮助吗?有什么办法我现在可以用吗。
浏览 6
提问于2016-06-02
得票数 1
回答已采纳
1
回答
Apache
Flink
:如何为键控CoFlatMapFunction划分事件?
apache-flink
、
flink-streaming
这是一个关于连接
的
键控
流
的
非常基本
的
问题。如果我有两个
流
,具有共享相同逻辑键
的
相关事件,并且这些
流
正在连接(使用键逻辑连接),并且都以> 1
的
并行性运行,那么
Flink
如何保证来自不同
流
的
两个具有相同逻辑键
的
事件最终在同一并行操作符实例中?
Flink
将保证患者"JohnDoe“
的
所有Temperature事件都将在相同
的<
浏览 79
提问于2018-06-03
得票数 0
回答已采纳
1
回答
Flink
:支持多个执行环境吗?
join
、
apache-flink
、
environment
、
flink-streaming
在
Flink
程序中创建多个ExecutionEnvironments可以吗?更具体地说,在相同
的
主方法中创建一个ExecutionEnvironment和一个StreamExecutionEnvironment,这样就可以处理批处理,然后再传输到
流
,而不会出现问题?我猜另一种可能是将程序分成两部分,但为了我
的
测试目的,这似乎更好。
Flink
为这种情况做好准备了吗?所有这些看起来都很好,但当join在一个公共索引上运行两个
流
并使用window(TumblingProcessingTimeW
浏览 6
提问于2019-10-10
得票数 1
回答已采纳
1
回答
以字符串值表示
的
Apache
Flink
表查询结果
java
、
apache-flink
、
flink-sql
我正在从
flink
表api编写一个查询来检索一条记录。然后检查是否找到一条记录,如果找到,则获取该记录
的
每个列值
的
字符串值。name | phone || 01| sam | 23354 || 03| kim | 23351 |sudo代码: foundRecord = find recor
浏览 4
提问于2020-05-30
得票数 0
回答已采纳
1
回答
StreamTableEnvironment能够针对批处理
流
运行吗?
apache-flink
然而,可以使用
流
执行模式在那里处理有界
流
,但效率较低。这是否意味着StreamTableEnvironment可以处理批处理
流
,但效率较低,因为不能将StreamTableEnvironment配置为在批处理模式下运行?
浏览 8
提问于2021-07-29
得票数 0
回答已采纳
点击加载更多
相关
资讯
Flink on Hive构建流批一体数仓
Flink1.11+Hive批流一体数仓
深度解读:Flink 1.11 SQL流批一体的增强与完善
基于Flink+Hive构建流批一体准实时数仓
Flink 如何进行流与流之间的连接和联合?
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券