Flink如何发现每个键的所有kafka分区_如何打印Flink开始读取的每个Kafka主题分区的起始偏移量？_如何使用带有特定分区的Apache Flink将数据作为键/值发送到Kafka - 腾讯云开发者社区

apache-kafka、apache-flink、flink-streaming

我们希望在读取来自kafka的消息时实现并行性。因此，我们希望在flinkkafkaconsumer中指定分区编号。它将读取kafka中所有分区的消息，而不是特定的分区号。kafkaConsumer = new FlinkKafkaConsumer<String>("EventLog", new SimpleStringSchema(), properties); 请建议任何更好的选项

浏览 139提问于2020-07-09得票数 1

1回答

Flink如何发现每个键的所有kafka分区

apache-flink、flink-streaming

我在我的数据流中使用"keyby“。我希望flink发现每个密钥的所有kafka分区。我有30个分区和12个任务。我通过用户id "keyby“我的数据。我认为每个任务的flink只能发现特定的kafka分区&我不能在一个任务中检测到每个用户<em

浏览 29提问于2019-10-07得票数 0

1回答

我仍然不能清楚地理解并行性，比方说，我们有一个flink集群，它有足够的插槽。在我们的flink工作中，我们从3个不同的kafka集群中使用3个kafka主题，每个主题有10个分区。如果我们将并行性设置为10，那么就会使用10个槽，这意味着，根据我的理解，10个线程对吗？如果这10个线程“连接”到topic_1，那么就没有线程读取topic_2和topic_3。如果我们将并行性设置为30，那么就有30个线程，但这30

浏览 0提问于2019-03-13得票数 12

回答已采纳

1回答

Flink Kafka生产者在发布键流时抛出异常。

apache-flink

我认为这里的问题是，我使用键来确定输出分区，这导致P接收器子任务对每个扇出写入N个输出分区。理想情况下，每个子任务只会写入单个分区。作业具有下列约束/属性：2:接收器子任务并行性最初将等于输出分区的数量。3:我将来应该能够在不违反#1的</

浏览 2提问于2019-10-10得票数 1

1回答

利用输入分区来避免任务管理器之间的通信。

apache-flink、apache-beam、flink-streaming

我们有一个Flink管道，通过将数据与相同的键("client-id")结合在同一个窗口中，聚合每个“客户端”的数据。这个问题是微不足道的并行性的，并且输入Kafka主题有几个分区(与Flink并行性相同的数字)--每个分区都包含一个客户端的子集。也就是说，一个客户端总是在一个特定的Kafka</em

浏览 5提问于2021-11-05得票数 0

回答已采纳

1回答

Apache将流划分为输入Kafka主题相同

apache-kafka、parallel-processing、apache-flink、partitioning、kafka-topic

我想在Apache中实现以下场景：考虑到有4个分区的Kafka主题，我想使用不同的逻辑在Flink中独立地处理分区内的数据，这取决于事件的类型。特别是，假设输入的Kafka主题包含前面图像中描述的事件。每个事件都有不同的结构:分区1的字段"a“作为键，分区2的</

浏览 2提问于2020-10-03得票数 2

回答已采纳

1回答

kafka作为flink - partitioning的消息分派器

java、apache-kafka、apache-flink

我有一个进程，需要将某些数据分派到由3个节点组成的flink集群(通过kafka)。据我所知，总共会有两个不同的主题。所有的消息都会有时间戳。消息顺序必须保持不变。我不能理解消息分区(键)背后的机制。如果我希望拥有如上所述的简单消息分派器，消息分区重要吗？如果是这样，我应该根据什么来选择它？

浏览 1提问于2018-09-10得票数 0

1回答

在阅读卡夫卡时使用KeyBy vs reinterpretAsKeyedStream()

apache-flink、flink-streaming

我有一个简单的Flink流处理应用程序(Flink版本1.13)。Flink应用程序从Kakfa读取，对记录进行有状态处理，然后将结果写回Kafka。在阅读了卡夫卡主题之后，我选择使用reinterpretAsKeyedStream()而不是keyBy()来避免混乱，因为这些记录已经在Kakfa中分区了。在Kakfa中用于分区的键是记录的字符串字段(使用默认的kafka分区

浏览 35提问于2022-06-15得票数 0

3回答

用于消息处理的多个节点

concurrency、apache-kafka、apache-flink、spring-kafka、high-availability

我们在Kubernetes上部署了一个spring引导应用程序来处理消息:它从Kafka主题中读取，然后执行一些映射，最后，它写到Kafka主题。为了获得更高的性能，我们需要更快地处理消息，因此我们引入了这个春季引导应用程序的多个节点。请自

浏览 6提问于2020-04-24得票数 0

1回答

如何使用带有特定分区的Apache Flink将数据作为键/值发送到Kafka

apache-kafka、apache-flink、flink-streaming

我在Flink中有一个负载，如下所示； { "total": 5 } 我想通过指定的分区将数据以key-value格式发送给kafka。对于分区程序，我将使用Modulo分区程序。模数分割器的一个例子 partitionId = value % numPartitions 假设numPartitions参数是3。如果我们可以使用上面定义的有效负载的m

浏览 23提问于2021-04-11得票数 0

回答已采纳

1回答

Flink读到Kafka，在某些情况下，消费速度急剧下降。

java、apache-kafka、apache-flink

我们有一个Flink作业(Flink版本: 1.9)，它通过键连接两个kafka源，对于每个键，启动一个5分钟的定时器，消息被缓存在Flink状态，当定时器结束时，将具有相同键的消息合并到一个胖消息中(通常每个键有1~5条消息)并将其发送给kafka。 source1 (160个分区，每分钟

浏览 1提问于2021-06-04得票数 0

回答已采纳

1回答

事件处理在Flink和恢复中的顺序

apache-flink、flink-streaming、flink-cep

我已经研究Flink一个多星期了。我们正在消费来自Kafka的事件，我们希望事件属于特定的对象，id需要按照事件时间的顺序进行处理。检查点机制是否知道未被处理的事件，它将如何请求Kafka有关这些事件？在CallCenter中，代理将接收呼叫并进入不同的状态。我们需要在处理这些问题的同时，扩大规模。在具有并行进程的Flink集群中，我们不应该在代理状态不好<e

浏览 1提问于2018-11-26得票数 1

回答已采纳

3回答

使用Flink-Kafka连接器均匀地消耗事件

apache-flink、flink-streaming

我正在使用Flink来处理Kafka的流数据。流程是非常基本的，从Kafka消耗，数据丰富，然后沉到FS。偶尔，在一些Kafka分区中会出现延迟。重新启动应用程序可以帮助Flink“重新平衡”消费和延迟。然而，过了一段时间，我看到了

浏览 4提问于2020-06-16得票数 2

回答已采纳

1回答

如何在flink作业之间共享状态？

apache-flink、flink-streaming、flink-cep

我从我的.jar文件运行多个作业。我想在我的工作之间共享状态。但是所有输入在每个作业中都会消耗(来自kafka)，并生成重复的输出。我看到了flink面板。所有的工作‘记录发送’是3。我想必须拆分数字到我的工作。我使用此命令创建作业 bin/flink run app.jar 我怎么才能修复它？

浏览 46提问于2019-09-29得票数 0

回答已采纳

1回答

使用Apache Spark/Apache Flink进行缩放

apache-spark、apache-kafka、apache-flink

我计划了一个从Apache读取的应用程序，经过(可能耗时的)处理后，将数据保存到数据库中。我的例子是消息，而不是流，但为了可伸缩性，我正在考虑将其插入Spark或Flink，但无法理解这些扩展:我的应用程序，当Spark/Flink的一部分读取了Kafka的一些数据，然后退出或继续阅读吗？那么，Spark/Flink将如何决定他们必须生成更多的我的</e

浏览 4提问于2017-09-20得票数 0

回答已采纳

1回答

集群中的Apache流不会将作业与工人分开。

streaming、cluster-computing、apache-kafka、apache-flink

我的目标是建立一个高吞吐量集群，使用Kafka作为源，使用Flink作为流处理引擎。这就是我所做的。<WORKER_IP_ADDR>两个节点上的flink设置位于同名文件夹中。中的Flink依赖项。>org.apache.flink</groupId> <artifactId>

浏览 7提问于2015-08-28得票数 9

回答已采纳

2回答

Flink kafka - Flink作业不向不同分区发送消息

apache-kafka、apache-flink、kafka-producer-api

我的配置如下： speStream.addSink(new FlinkKafkaProducer011(kafkaTopicName,new 场景1: 我在eclipse上写了一个flink作业(生产者)，它从文件夹中读取一个文件，并将msgs放在kafka</e

浏览 0提问于2018-08-29得票数 2

回答已采纳

2回答

flink kafka消费者groupId不起作用

apache-kafka、apache-flink

我认为这应该是这样的:如果向Kafka发送2条消息，那么flink程序中的每条或一条将处理这2条消息完全两次(假设总共有2行输出)。我试图使用两个卡夫卡消费者在相同的主要功能的flink程序。共处理4条信息。我还试着运行两个flink

浏览 10提问于2016-07-28得票数 6

回答已采纳

1回答

同一Kafka主题的多个Flink管道

apache-kafka、apache-flink

背景时不时地，我们的Flink不能处理突发信息。如果我们使用常规的Kafka用户，那么就像添加一个用户一样简单(假设我们有足够的Kafka分区)，并且Kafka将在所有用户之间重新分配主题分区。Flink <

浏览 27提问于2019-11-14得票数 1

1回答

Flink中具有并行性的多个kafka主题

apache-flink、kafka-consumer-api

卡夫卡分区的数目固定为15，所以当我通过改变Flink中的并行数来测试它时，15是理想的情况，它等于kafka分区的数目。在这种情况下，kafka集群有30个分区，所

浏览 6提问于2022-09-02得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Flink kafka消费者从特定分区获取消息

Flink如何发现每个键的所有kafka分区

Flink，在使用多个Kafka源时，如何正确设置并行性？

Flink Kafka生产者在发布键流时抛出异常。

利用输入分区来避免任务管理器之间的通信。

Apache将流划分为输入Kafka主题相同

kafka作为flink - partitioning的消息分派器

在阅读卡夫卡时使用KeyBy vs reinterpretAsKeyedStream()

用于消息处理的多个节点

如何使用带有特定分区的Apache Flink将数据作为键/值发送到Kafka

Flink读到Kafka，在某些情况下，消费速度急剧下降。

事件处理在Flink和恢复中的顺序

使用Flink-Kafka连接器均匀地消耗事件

如何在flink作业之间共享状态？

使用Apache Spark/Apache Flink进行缩放

集群中的Apache流不会将作业与工人分开。

Flink kafka - Flink作业不向不同分区发送消息

flink kafka消费者groupId不起作用

同一Kafka主题的多个Flink管道

Flink中具有并行性的多个kafka主题

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐