腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
在
flink
中
如何
设置
Joinstream
的
set
parallelism
、
当使用
joinStream
连接两个流时,我不能
设置
joinStream
的
并行度,它总是为1 aStream.assignTimestampsAndWatermarks(new AWatermarks(有没有办法
设置
JoinStream
的
并行度?
浏览 15
提问于2020-12-07
得票数 0
1
回答
使用Apache Spark/Apache
Flink
进行缩放
、
、
我计划了一个从Apache读取
的
应用程序,经过(可能耗时
的
)处理后,将数据保存到数据库
中
。我
的
例子是消息,而不是流,但为了可伸缩性,我正在考虑将其插入Spark或
Flink
,但无法理解这些扩展:我
的
应用程序,当Spark/
Flink
的
一部分读取了Kafka
的
一些数据,然后退出或继续阅读吗?那么,Spark/
Flink
将
如何
决定他们必须生成更多
的
我
的</e
浏览 4
提问于2017-09-20
得票数 0
回答已采纳
1
回答
parallelism
.default不适用
Flink
独立
的
Kubernetes会话模式
、
、
、
我在跟踪这份文件 taskmanager.numberOfTaskSlots: 4从
Flink
仪表板正确读取此属性: 但是,当我提交
Flink
作业时,所有任务都与1具有并行
浏览 2
提问于2022-01-18
得票数 0
1
回答
在
Flink
中
对每个工作人员
设置
taskmanager.numberOfTaskSlots
、
我正在一个独立
的
集群
中
工作。所有服务器都可以运行taskmanager.sh。我
的
集群是异构
的
,具有不同
的
核心计数和内存。我运行
的
代码()是一个python单线程操作。我希望为每个服务器
设置
不同
的
任务槽数。
如何
让
flink
为不同
的
服务器运行不同
的
插槽?我还希望这一声明: A
Flink
c
浏览 5
提问于2019-10-08
得票数 0
1
回答
如何
在
flink
作业之间共享状态?
、
、
我从我
的
.jar文件运行多个作业。我想在我
的
工作之间共享状态。但是所有输入
在
每个作业中都会消耗(来自kafka),并生成重复
的
输出。我看到了
flink
面板。所有的工作‘记录发送’是3。我想必须拆分数字到我
的
工作。 我使用此命令创建作业 bin/
flink
run app.jar 我怎么才能修复它?
浏览 46
提问于2019-09-29
得票数 0
回答已采纳
2
回答
cloudwatch
中
的
KDA度量与
Flink
度量不同
、
、
、
我有一个
Flink
应用程序部署
在
AWS动态数据分析。我目前
的
设置
是:
Parallelism
per KPU=4从
Flink
UI:计数:从Cloudwatch:计数: Nu
浏览 22
提问于2022-03-26
得票数 1
1
回答
事件时间
的
聚合函数和处理函数
、
输入代码hereNeed,使用
flink
聚合kafka stream
中
的
数据值,然后输出一个新
的
主题。 聚合应该在eventtime发生,而不是process time,这意味着数据对象
中
的
时间戳。遵循
Flink
教程
中
的
示例,使用TumblingEventTimeWindow,但根本不调用聚合getResult方法。import org.apache.
flink
.api.java.utils.ParameterToo
浏览 1
提问于2019-08-06
得票数 0
1
回答
如何
在提交作业前获取
Flink
任务管理器编号?
、
我通过以下方式启动了
Flink
数据流作业 val env = StreamExecutionEnvironment.getExecutionEnvironmentenv.execute() 我想控制与任务管理器编号相关
的
env并行度,就像上面的代码一样。或任何解决方法来
设置</e
浏览 32
提问于2021-06-17
得票数 0
回答已采纳
1
回答
Flink
:所有流量都分配给一个任务管理器(集群中有1个作业管理器+2个任务管理器)
、
我有以下
设置
:
Flink
version: 1.122 Task Manager
parallelism
.default: 2 taskmanager.numberOfTaskSlots2900m res
浏览 9
提问于2021-06-02
得票数 0
回答已采纳
1
回答
没有文档化
的
Flink
测试依赖关系或MiniClusterWithClientResource,
flink
集成测试是
如何
工作
的
?
、
我使用
的
是
Flink
1.15.1和JUnit5。我想知道从中改编
的
下面的集成测试是
如何
工作
的
,而不包含
flink
-test-utils依赖项和MiniClusterWithClientResource静态实例。;import org.junit.jupiter.api.Test依赖项和MiniClusterWithClientReso
浏览 38
提问于2022-08-09
得票数 0
回答已采纳
4
回答
本地
Flink
配置从IDE独立运行
如果我想在本地运行一个
Flink
应用程序,直接从Intellij内部运行,但我需要指定配置params (比如fs.hdfs.hdfssite来
设置
S3访问),那么除了ExecutionEnvironment.createLocalEnvironment我可以
在
我
的
项目中有一个
Flink
配置并指向本地应用程序吗? 这样做合适吗?或者,您会
设置
IDE将应用程序提交到真正
的
本地
Flink
实例吗?
浏览 3
提问于2016-06-10
得票数 8
回答已采纳
1
回答
集群
中
的
Apache流不会将作业与工人分开。
、
、
、
我
的
目标是建立一个高吞吐量集群,使用Kafka作为源,使用
Flink
作为流处理引擎。这就是我所做
的
。主节点上
的
slaves文件如下所示:localhost<
浏览 7
提问于2015-08-28
得票数 9
回答已采纳
2
回答
Flink
作业.UnfulfillableSlotRequestException:无法满足插槽要求。Req资源配置文件(ResourceProfile{未知})无法实现
、
但是当我检查UI
中
的
作业日志时会发现一个不同
的
错误,# It is not recommended to
set
bo
浏览 25
提问于2020-03-10
得票数 2
回答已采纳
3
回答
如何
为一组操作/工作流创建DAG表示?
、
、
、
我们使用apache
flink
进行流处理。文档说,
flink
基于定义
的
操作(对流数据
的
转换链)生成执行图/DAG。我还可以
在
UI门户上看到DAG表示。 我有点好奇
如何
在幕后做到这一点。有没有为
flink
做这件事或者由
Flink
自己实现
的
可用
的
库?
浏览 33
提问于2020-02-10
得票数 0
2
回答
在任务管理器之间均匀分配
Flink
运算符
、
我
在
一个由15台机器组成
的
裸机集群上制作了一个
Flink
流应用程序
的
原型。我使用
的
是yarn-mode,有90个任务槽(15x6)。 该应用程序从单个Kafka主题读取数据。Kafka主题有15个分区,因此我也将源运算符
的
并行度
设置
为15。然而,我发现
Flink
在
某些情况下会将2-4个使用者任务实例分配给同一个任务管理器。这会导致某些节点变得网络受限( Kafka主题服务于大量数据,而机器只有1G网卡)和整个数据流
中
浏览 0
提问于2018-08-10
得票数 2
1
回答
如果所有服务器配置都不同,
flink
中
需要提供多少个插槽?
我
在
kubernetes上运行
flink
。以下是服务器
的
配置: server - 1: 4cpu, 16gb RAMserver - 3: 2cpu, 8gb RAM 通过使用上面的配置,
如何
设置
并行度和插槽这是正确
的
吗? taskmanager.numberOfTaskSlots: 2
parallelism
.default: 3 根据了解,每个cpu将被视为1个插槽。
parallelism
.de
浏览 38
提问于2020-07-23
得票数 0
回答已采纳
2
回答
Flink
从GenericRecord流生成动态流
、
、
、
、
我有一个用例,当我们
在
模式注册表
中
为主题起诉TopicRecordNameStrategy时,
在
单个Kafka主题中有多种类型
的
Avro记录。现在,我不能将此流汇到parquet格式
的
hdfs/s3
中
,因为此流包含不同类型
的
模式记录。因此,我通过应用过滤器并创建不同
的
流,然后分别下沉每个流,为每种类型过滤不同
的
记录。;import
浏览 69
提问于2020-02-21
得票数 1
回答已采纳
1
回答
当并行度大于1时,
Flink
不转发Kafka度量
、
我有一个
Flink
的
工作,从卡夫卡(0.9版),并写信给雷迪斯。我希望监控由
Flink
应该能够转发
的
由Kafka发出
的
records-consumed-rate和records-lag-max度量。当我以1
的
并行度开始作业时,我看到这个度量很好地发出。但是,如果我使并行度大于1,则不再转发此度量。作业
在
并行度>1时运行,因为我可以看到条目正在写入Redis。: 7 并行性由streamExecutionEnvironment.setPara
浏览 0
提问于2019-04-18
得票数 0
2
回答
DataSet群
的
等价性-- DataStream
的
带分区器
,然后用一个.withPartitioner(...)创建组,这样一个组(已知
的
组比其他组大得多)将被分配到自己
的
时隙,而其他组将被分配到其余
的
时隙
中
。
在
切换到DataStream时,我看不到任何简单
的
方法来做同样
的
事情。如果我深入研究.keyBy(...),我看到它使用
的
是一个PartitionTransformation和一个KeyGroupStreamPartitioner,这是很有希望
的
--但是PartitionTransfo
浏览 3
提问于2022-03-04
得票数 1
1
回答
单个
flink
管道
的
多个弹性搜索汇
、
、
我
的
要求是将数据发送到不同
的
ES接收器(基于数据)。如果数据包含特定信息,将其发送到sink1,否则将其发送到sink2等(基本上是根据数据动态地将其发送到任何一个接收器)。我还想分别为ES sink1、ES sink2、Es sink3等
设置
并行性。-> Es sink3 (
parallelism
2)我可以想出一个解决方案,但有一个中间的卡夫卡主题,我写(topic1
浏览 0
提问于2020-10-14
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券