腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
Flink
中
通过
广播
执行
加入
操作
、
、
我想
加入
一个大的小溪和一个小的小溪。我想
广播
较小的流,然后将其连接到较大的流。但是,我不确定如何存储
广播
的模式,以及如何在processElement method
中
查找匹配的模式,然后将这两个元素组合在一起。 编辑:我已经设法使用下面的代码片段制作了一个
广播
加入
的原型。我调整了
在
官方训练资源库中找到的普通连接:https://github.com/apache/
flink
-training/blob&
浏览 28
提问于2021-09-08
得票数 0
2
回答
是否有一种方法可以
在
apache beam
中
编写一个
操作
符,它在不同的跑步者
中
运行的不同?
例如,假设我希望
通过
在
键上
加入
一个具有更多值的查找表来丰富集合。
在
火花运行器
中
,我更愿意为这个
操作
符做一个
广播
连接,就像在
flink
运行器中一样,我想进行rpc调用(比如redis),根据键加载值。相同的逻辑语义,但基于运行程序的不同
执行
。
浏览 2
提问于2022-01-22
得票数 -1
回答已采纳
2
回答
在
map函数内部闪动DataSet连接
、
、
、
、
所以我
在
一个DataStream上运行一个映射函数,在这个映射函数
中
,我想连接两个独立的DataSets。我只是想知道这在
Flink
中
是否可行。
浏览 17
提问于2018-01-21
得票数 0
1
回答
在
flink
广播
流
中
处理大数据
、
、
、
、
我使用的是一个
Flink
流应用程序,它的输入源是Kafka。
在
我的应用程序
中
总共使用了4个流。一个是主要数据流,另一个是3个用于
广播
流。流B是一个丰富数据集。我使用类型
加入
了三个
广播
流。我已经
广播
为B流,并且能够
在
广播
过程
中
接收函数上下文状态(即在processBroadcastElement()
中
)。如果可能的话,存储大数据意味着,有多少数据(即数据大小)
浏览 3
提问于2020-07-24
得票数 0
1
回答
如何在Apache
Flink
中
的并行
执行
之间共享信息?
我想知道是否有任何方法可以在运行时
在
Apache
Flink
中
的一个
操作
符内的并行
执行
之间传输信息?我只需要发一点信息。
Flink
中
的
广播
变量不起作用,因为它不能在运行时
广播
。
浏览 6
提问于2018-02-24
得票数 0
1
回答
如何在
Flink
-Scala
中
实现简单的缓存文件?
、
我是
Flink
的新手。我真的很困惑如何进行文件缓存并将其加载到数据集中?我找不到一个简单的例子。我搞不懂为什么我们需要先创建一个数据集来调用"RichMapFunction“?
在
我发现的
中
,它
执行
了与其他数据集的连接。谢谢。
浏览 5
提问于2021-07-23
得票数 0
1
回答
Flink
SQL行为
、
、
我想对批处理数据
执行
Flink
SQL。(S3
中
的CSV)例如,我的查询包括对两个表进行筛选和
加入
筛选的结果。我希望
Flink
不要以阻塞批处理的方式实现这两个表,然后
通过
join传递结果,而是使用流哈希连接
操作
符,就像datastream
中
的那样。 我怎样才能做到这一点?我正在使用PyFlink。
浏览 6
提问于2022-04-02
得票数 1
1
回答
具有多个并行性的
Flink
广播
状态
、
、
该
广播
状态是
通过
每10分钟读取5个S3文件,进行一些处理,并创建播放的int to list of strings地图来创建的。问题:在哪里读取文件,是否
在
JobManager读取和处理文件,并将处理过的内容发送给任务管理人员。是任务管理人员负责所有的读取和处理。例如:假设有一个卡夫卡流,有5个分区,需要
广播
。还有一个下游
操作
符,它的并行性也是5。 Partition1使用者任务,从流
中
读取元素并将其设置为
广播
状态。一旦设置完毕,状态就会
广播
到所
浏览 2
提问于2019-10-21
得票数 0
1
回答
定期更新的
Flink
源
、
、
我试图为长期运行的
flink
作业实现外部配置。我的想法是创建自定义源,
通过
http定期(每5分钟)从外部服务轮询JSON编码的配置。 如何创建每N分钟
执行
一次
操作
的源?如何将此配置重新
广播
给所有
执行
程序?
浏览 2
提问于2017-10-25
得票数 2
回答已采纳
1
回答
在
Flink
作业
中
传递两个流来使用MainStreams进行
操作
、
在
Flink
-作业目前,我有两个流,一个主要数据流每分钟更新一次从卡夫卡主题,另一个流(
广播
流),这是用于KeyedBroadcastProcessFunction的进程元素功能的一些计算与主流数据。1)如何
通过
必须在
Flink
状态下可用的第三流,以便与主数据和
广播
状态数据一起进行计算?
在
keyedBroadcastProcess函数
中
? ( 2)对于主要数据,我们能有两个
广播
流吗?3)由于流数据是完全不同的数据,
广播</em
浏览 5
提问于2020-06-03
得票数 0
回答已采纳
2
回答
将BroadcastConnectedStream连接到AsyncIO
我需要让一个AsyncIO富函数根据最新的规则集
执行
调用。对于像map这样的
操作
,我能够
通过
关注这篇博客文章来处理具有丰富功能的BroadcastConnectedStream:https://
flink
.apache.org/2019/06/26/broadcast-state.html但是,创建AsyncIO函数需要DataStream作为输入,而BroadcastConnectedStream不需要(https://ci.apache.o
浏览 29
提问于2020-06-19
得票数 0
回答已采纳
1
回答
在
Flink
中
广播
“
加入
”
、
、
、
、
是否有任何方法,我可以使用
广播
连接在
FLINK
与我
在
火花使用的方式。我正在使用联接,但是数据很大,所以我需要
广播
连接。 谢谢
浏览 0
提问于2019-10-17
得票数 0
回答已采纳
1
回答
Flink
流连接可能返回大结果集的维度表。
、
、
、
有些事件是
广播
事件,意味着当收到此类事件时,我需要转到数据库表,查找事件的所有订阅者,
在
我的用例
中
可以是10,000行,然后将单个
广播
事件转换为10,000个通知事件。对于普通事件类型,可以使用附加的user_id键来
加入
订阅表,而订阅表没有问题。--如何
加入
大型ResultSet,将它们返回内存--似乎不是一个可伸缩的解决方案。如何组织处理管道,使正常事件和
广播
事件不相互干扰。我不希望连续长时间运行的
广播
事件阻塞正常事件的处理管道。 我刚刚
浏览 2
提问于2020-04-26
得票数 0
2
回答
为什么“
广播
状态”可以存储动态规则,而
广播
()
操作
符却不能?
、
我对“
广播
状态”和
广播
()
操作
符之间的区别感到困惑,最后在下面的线程
中
得到了
Flink
专家的帮助。最后得出结论:“
广播
状态”可以
在
RichCoFlatMap键控流
中
存储动态规则,而RichCoFlatMap ()运算符不能存储动态规则,那么我可以知道“
广播
状态”如何
通过
RichCoFlatMap存储动态规则
浏览 2
提问于2018-05-28
得票数 0
回答已采纳
3
回答
在
Flink
中
缓存外部数据库的最佳方式是什么?
、
外部数据库由每个键的一组规则组成,这些规则应该应用于
Flink
作业
中
的每个流元素。因为为每个元素调用DB并检索规则的开销非常大,所以我希望
在
初始化时从数据库获取规则,并将其存储
在
本地缓存
中
。当在外部数据库
中
更新规则时,将向
Flink
作业发布一个状态更改事件,该事件应用于获取规则并刷新此缓存。 实现我所描述的目标的最佳方法是什么?
浏览 0
提问于2021-01-22
得票数 0
1
回答
KTable初始化和持久性
、
、
、
例如,考虑一个流应用程序,
在
该应用程序
中
,我们正在监视
在
系统中注册的司机的车辆事件。这些事件将以KStream的形式出现。
在
系统中注册的驱动程序将在一个KTable
中
,我们需要
加入
事件和驱动程序来获得一些输出。假设我们
通过
一个微服务
在
系统
中
插入一个新的驱动程序,它将数据推送到Cassandra表
中
,然后
通过
更改数据捕获到KTable主题。会更好地使用星火流或
Flink
将事件流与卡桑
浏览 7
提问于2022-09-12
得票数 0
回答已采纳
1
回答
是否会阻止
广播
状态的源进程?
、
使用
flink
版本1.13.0 我
在
我的应用程序中使用
广播
状态,它将每2分钟加载大量数据( Map类型的大约500'000个数据) 我
在
web-ui中看到的拓扑图发现,每次
广播
源加载时,它都有50%-100%的背压,
加入
的过程有50%-100%的繁忙。
浏览 27
提问于2021-08-16
得票数 0
回答已采纳
2
回答
什么意味着“
广播
状态”为
Flink
的CEP库的“动态模式”特性的实现打开了障碍?
、
、
从
Flink
1.5发布公告
中
,我们知道
Flink
现在支持“
广播
状态”,并描述了“
广播
状态为
Flink
的CEP库的”动态模式“特性的实现打开了障碍。”这是否意味着目前我们可以使用“
广播
状态”来实现“动态模式”而不需要
Flink
CEP?另外,我不知道在有或没有
广播
状态的情况下实现
Flink
CEP的“动态模式”有什么区别?============= 测试
广播
数据流的更新.使用键控-datastrea
浏览 1
提问于2018-05-26
得票数 0
回答已采纳
2
回答
是否有一种方法可以将消息
广播
到所有任务管理器
、
、
我想知道
在
flink
中
是否有一种方法可以
广播
一个事件(或类似的东西),如果特定的事件从源代码读取到所有的任务管理器
中
。更具体地说,我正在使用映射状态聚合状态数据,如果从源读取了一些事件,我希望所有任务管理器都
执行
特定的
操作
有可能吗?
浏览 2
提问于2019-10-07
得票数 0
1
回答
Apache :为DataStream API添加侧输入
、
、
、
、
在
我的Java应用程序
中
,我有3 DataStreams。例如,一个流数据是从Kafka消费的,另一个流数据是从Apache消费的。对于这两个流,对象类型是不同的。第三种是
广播
流(因为这些数据是从Kafka消费的)。
加入
了缓慢变化的数据流:--我们用来丰富内容的侧输
浏览 3
提问于2020-06-02
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
在Python中通过Tkinter执行Tcl命令
如何记录你在终端中执行的所有操作
看我如何通过Tor Onion在Windows中执行远程Shell
中汽创智加入车用操作系统与泛在操作系统联合实验室
Flink高级应用模式第二辑:应用模式的动态更新
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券