开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如果我们没有在kafka中使用delivery回调，那么在produce之后调用poll()有什么意义吗？

在Kafka中，poll()方法主要用于消费者（Consumer）从Kafka集群中拉取消息。如果你没有使用生产者的delivery回调，那么在produce之后调用poll()对于生产者（Producer）来说并没有直接的意义。

基础概念

Kafka Producer: 负责将消息发送到Kafka集群。
Kafka Consumer: 负责从Kafka集群中消费消息。
delivery回调: 生产者在发送消息后，可以通过设置回调函数来获取消息发送的结果，包括成功或失败的信息。

为什么调用`poll()`没有意义

生产者（Producer）: 生产者的主要任务是发送消息到Kafka集群。调用poll()方法是消费者的行为，用于从Kafka集群中拉取消息。因此，生产者在调用produce()发送消息后，调用poll()是没有意义的。
消费者（Consumer）: 消费者通过调用poll()方法从Kafka集群中拉取消息。如果生产者没有使用delivery回调，那么生产者在发送消息后无法直接获取消息发送的结果。

解决方案

如果你是生产者，并且希望在发送消息后获取发送结果，应该使用delivery回调。以下是一个简单的示例代码：

Properties props = new Properties();
props.put("bootstrap.servers", "localhost:9092");
props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

Producer<String, String> producer = new KafkaProducer<>(props);

producer.send(new ProducerRecord<>("my-topic", "key", "value"), new Callback() {
    @Override
    public void onCompletion(RecordMetadata metadata, Exception exception) {
        if (exception != null) {
            exception.printStackTrace();
        } else {
            System.out.println("Message sent to topic: " + metadata.topic() + " partition: " + metadata.partition() + " offset: " + metadata.offset());
        }
    }
});

producer.close();

参考链接

如果你是消费者，并且需要从Kafka集群中拉取消息，那么调用poll()方法是正确的做法。以下是一个简单的示例代码：

Properties props = new Properties();
props.put("bootstrap.servers", "localhost:9092");
props.put("group.id", "test");
props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);
consumer.subscribe(Arrays.asList("my-topic"));

while (true) {
    ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
    for (ConsumerRecord<String, String> record : records) {
        System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value());
    }
}

参考链接

Apache Kafka Consumer Poll

总结来说，生产者在发送消息后调用poll()是没有意义的，应该使用delivery回调来获取消息发送的结果。消费者则需要调用poll()方法来拉取消息。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Kafka生产者客户端几种异常Case详解

日志里面有提示你是哪个TopicPartition有问题。有什么影响: 影响的是你自身的回调业务逻辑。那么消息是发送成功还是失败了呢？判断消息是否发送成不是UserCallBack决定的。...就算你这里抛异常了,那么消息该成功还是成功。解决办法 UserCallback这个回调很重要,它是在整个I/O线程里面的,它的性能会影响这个生产者发送消息的性能。...解决方案也没有一个统一的办法,我们只能是根据具体现象去做调优尝试。 buffer.memory 尝试设置大一点。...因为用户回调接口是在I/O线程中执行的, 如果用户在该回调接口里面写的方法性能很差,会增加整个调用链路的时间, 链路不结束,消息了累加器中的消息就一直不能释放。...-> 用户回调 -> 释放Batch(同时从inFlightBatches移除) Batch自从加入到 inFlightBatches 中之后一直迟迟没有完成整个请求链路。

6.5K8 0

Python Kafka客户端confluent-kafka学习总结

等待期间，如果消息被确认，即成功写入kafka中，将调用回调 callback指定方法 acked producer.poll(1) ### 同步写kafka producer.produce...一个典型的Kafka消费者应用程序以循环消费为中心，该循环重复调用poll方法来逐条检索消费者在后台高效预取的记录。例中poll超时被硬编码为1秒。...如果在此期间没有收到任何记录，则Consumer.poll()将返回一个空记录集。...注意，在使用完Consumer之后，应该始终调用Consumer.close()，以确保活动套接字处于关闭状态，并清理内部状态。...commit callback回调可以是任何可调用的，并且可以作为配置参数传递给消费者构造函数。

1.5K3 0

confluent-kafka-go源码分析

confluent-kafka-go是已知的kafka 客户端中最快的，为什么呢？因为它非常轻量，通过cgo 对librdkafka做了一个封装，所以本质上运行的是一个c客户端。...但是如果我们直接用go来连接会报错 1617546888.931|FAIL|rdkafka#producer-1| [thrd:bogon:9092/0]: bogon:9092/0: Failed...1， kafka.NewProducer 2， for e := range p.Events() 在协程中监听生产者事件 3， p.Produce 生产消息消费者也主要调用了三个接口 1， kafka.NewConsumer...，有两种解决方法： 1，编译一个静态链接库，放在librdkafka_vendor 下面，修改bundle-import.sh 文件，编译 2，编译librdkafka成功后，在编译调用代码的时候，指定为动态加载...7,Events()仅仅是返回了事件的channel func (p *Producer) Events() chan Event { return p.events } 8，produce函数和初始化的时候注册的函数底层调用的是同一个

1.1K1 0

Kafka的消息会丢失和重复吗？——如何实现Kafka精确传递一次语义

如果消息重复了呢，我们是否需要复杂的逻辑来自己处理消息重复的情况呢，这种情况恐怕相当复杂而难以处理。但是如果我们能保证消息exactly once，那么一切都容易得多。 ?...图无人机实时监控下面我们来简单了解一下消息传递语义，以及kafka的消息传递机制。首先我们要了解的是message delivery semantic 也就是消息传递语义。...两次中有一次会丢失消息，或者有一次会重复，那么最终的结果就是可能丢失或者重复的。...： 0：producer完全不管broker的处理结果回调也就没有用了并不能保证消息成功发送但是这种吞吐量最高 all或者-1：leader broker会等消息写入并且ISR都写入后才会响应...确实在kafka 0.11.0.0版本之前producer端确实是不可能的，但是在kafka 0.11.0.0版本之后，kafka正式推出了idempotent producer。

2.6K1 1

Kafka 最佳实践

Kafka 配置、监控、优化的内容，绝对是在实践中总结出的精华，有很大的借鉴参考意义，本文主要是根据 PPT 的内容进行翻译及适当补充。...OS 调优 OS page cache：应当可以缓存所有活跃的 Segment（Kafka 中最基本的数据存储单位）； fd 限制：100k+；禁用 swapping：简单来说，swap 作用是当内存的使用达到一个临界值时就会将内存中的数据移动到...Producer 的相关配置、性能调优及监控 Quotas 避免被恶意 Client 攻击，保证 SLA；设置 produce 和 fetch 请求的字节速率阈值；可以应用在 user、client-id...Consumer 配置 fetch.min.bytes 、fetch.max.wait.ms； max.poll.interval.ms：调用 poll() 之后延迟的最大时间，超过这个时间没有调用 poll...() 的话，就会认为这个 consumer 挂掉了，将会进行 rebalance； max.poll.records：当调用 poll() 之后返回最大的 record 数，默认为500； session.timeout.ms

2.3K4 1

kafka 网络模型1 请求响应流程

回顾在kafka 启动1 入口函数中，我们阅读了KafkaServer的注释，这里直接总结一下: KafkaServer有两种请求层, data层或control层 data层处理来自客户端和集群中其它...它之后的流程可以参考Kafka 源码解析之 Server 端如何处理 Produce 请求（十二）中的图: ?...如果没有，可以看下几章。...KafkaApis 不同的命令有不同的行为，是否发出响应/发出什么响应都是不同的。我们以PRODUCE命令为例，看看响应是如何生成的。 ?...④ 取出响应，交给Selector写出在Processor中，dequeueResponse方法会将响应出队 ? 那么该方法在哪里调用呢？

1.2K3 0

多图详解kafka生产者消息发送过程

如果链中间的拦截器（通常会修改记录）抛出异常，则链中的下一个拦截器将使用前一个未抛出异常的拦截器返回的记录调用。调用地方 ①. 拦截器执行时机在键值序列化之前 ②....那么客户端的准备条件有哪些呢？生产者客户端在最开始的时候都没有跟任何Node建立连接的, 当我们尝试发送之前会去检验一下连接是否建立成功(就是当前这一步), 如果没有的话,则会去尝试建立连接。...是否能够重试判断逻辑：batch没有超过delivery.timeout.ms && 重启次数<retiries 如果是DuplicateSequenceException异常的话,那么并不会做其他的处理...(), record.key(), record.value())); 注意: 这里的回调并不是指的一个Batch一个回调,这里是一个Batch里面有多少条消息,就有多少个回调。...每个ProducerBatch里面都有一个对象专门保存所有消息的回调信息 thunks . 在处理ProducerBatch返回信息的时候会遍历这个trunks, 来执行每个消息的回调。

5951 0

使用生成器把Kafka写入速度提高1000倍

[如果代码显示有问题，请点击阅读原文] 通过本文你会知道Python里面什么时候用yield最合适。本文不会给你讲生成器是什么，所以你需要先了解Python的yield，再来看本文。...但是当年我始终想不明白，这种写法与直接调用函数有什么区别，如下图所示。 ? 直到后来我需要操作Kafka的时候，我明白了使用yield的好处。...在一个Kafka生产者对象中展开列表，再把数据一条一条塞入Kafka。这样由于只需要获取一次生产者对象，所以需要耗费的时间大大缩短，如下图所示。 ?...这种写法在数据量小的时候是没有问题的，但数据量一旦大起来，如果全部先放在一个列表里面的话，服务器内存就爆了。于是我又修改了代码。...后记读者如果仔细对比第一段代码和最后一段代码，就会发现他们本质上是一回事。

1.5K2 0

多图详解kafka生产者消息发送过程

如果链中间的拦截器（通常会修改记录）抛出异常，则链中的下一个拦截器将使用前一个未抛出异常的拦截器返回的记录调用。调用地方 ①. 拦截器执行时机在键值序列化之前 ②....那么客户端的准备条件有哪些呢？生产者客户端在最开始的时候都没有跟任何Node建立连接的, 当我们尝试发送之前会去检验一下连接是否建立成功(就是当前这一步), 如果没有的话,则会去尝试建立连接。...其他异常或者没有异常则会走正常流程, 并且调用,如果有Exception也会返回。这个InterceptorCallback里面包含在拦截器和(用户自己的回调)。...())); 注意: 这里的回调并不是指的一个Batch一个回调,这里是一个Batch里面有多少条消息,就有多少个回调。...每个ProducerBatch里面都有一个对象专门保存所有消息的回调信息 thunks . 在处理ProducerBatch返回信息的时候会遍历这个trunks, 来执行每个消息的回调。

1.8K3 0

使用生成器把Kafka写入速度提高1000倍

但是当年我始终想不明白，这种写法与直接调用函数有什么区别，如下图所示。 [2018-04-13-21-51-37.png] 直到后来我需要操作Kafka的时候，我明白了使用yield的好处。...在一个Kafka生产者对象中展开列表，再把数据一条一条塞入Kafka。这样由于只需要获取一次生产者对象，所以需要耗费的时间大大缩短，如下图所示。...[witoutyield2.png] 这种写法在数据量小的时候是没有问题的，但数据量一旦大起来，如果全部先放在一个列表里面的话，服务器内存就爆了。于是我又修改了代码。...这样的写法，在上面这段代码中，一共1003条数据，每100条数据获取一次生产者对象，那么需要获取11次生产者对象，耗时至少为110秒。...[withyield.png] 后记读者如果仔细对比第一段代码和最后一段代码，就会发现他们本质上是一回事。

9311 0

【Rust日报】2023-09-13 RustRover – JetBrains 推出的独立 Rust IDE

RustRover – JetBrains 推出的独立 Rust IDE “什么时候会有 Rust IDE？” 这是用户经常提出的问题（八年了，你知道这八年我怎么过的吗？）...多年来 JetBrains 中 Rust 功能多以插件形式被支持。...Rust Kafka 客户端库一个在 librdkafka 基础上完全异步、基于 future 的 Rust Kafka 客户端库目前提供的主要功能有：支持自 0.8.x 以来的所有 Kafka...可定制的 rebalance，带有 rebalance 前和 rebalance 后的回调。同步或异步消息生成。可定制的偏移量提交。创建和删除 topic 以及添加和编辑 partition。...访问生产者和消费者指标、错误和回调。通过幂等和事务性生产者以及已提交读取的消费者实现一次性语义 (EOS)。

4292 0

【愚公系列】2023年03月 MES生产制造执行系统-004.Kafka的使用

生产者负责向Kafka发送消息，消费者负责从Kafka接收消息，主题是消息的分类，分区是主题的分片，偏移量是消息在分区中的位置。...Kafka有四个核心的API: The Producer API 允许一个应用程序发布一串流式的数据到一个或者多个Kafka topic。...-消费(持续订阅) /// /// 回调函数,若配置为非自动提交(默认为否),则通过回调函数的返回值判断是否提交</param...-消费(持续订阅) /// /// 回调函数,若配置为非自动提交(默认为否),则通过回调函数的返回值判断是否提交</param...-消费(持续订阅) /// /// 回调函数,若配置为非自动提交(默认为否),则通过回调函数的返回值判断是否提交</param

4442 0

深入理解 Linux 的 epoll 机制

在 epoll_ctl 的内部实现中，除了把句柄结构用红黑树管理，另一个核心步骤就是设置 poll 回调。思考来了：poll 回调是什么？怎么设置？...换句话说，如果一个“文件”所在的文件系统没有实现 poll 接口，那么就用不了 epoll 机制。第二个问题：poll 怎么设置？...在 epoll_ctl 下来的实现中，有一步是调用 vfs_poll 这个里面就会有个判断，如果 fd 所在的文件系统的 file_operations 实现了 poll ，那么就会直接调用，如果没有，...当 fd 满足可读可写的时候就会经过层层回调，最终调用到这个回调函数，把对应 fd 的结构体放入就绪队列中，从而把 epoll 从 epoll_wait 出唤醒。这个对应结构体是什么？...->poll ，把这个 fd 就绪之后的回调路径安排好。

8K12 5

Kafka 新版消费者 API（二）：提交偏移量

可能造成的问题：数据重复读假设我们仍然使用默认的 5s 提交时间间隔，在最近一次提交之后的 3s 发生了再均衡，再均衡之后，消费者从最后一次提交的偏移量位置开始读取消息。...commitAsync()也支持回调，在broker作出响应时会执行回调： // 把auto.commit.offset设为false，让应用程序决定何时提交偏移量 props.put("auto.commit.offset...在每次提交偏移量之后或在回调里提交偏移量时递增序列号。在进行重试前，先检查回调的序列号和即将提交的偏移量是否相等，如果相等，说明没有新的提交，那么可以安全地进行重试。...如果把存储到数据库和提交偏移量在一个原子操作里完成，就可以避免这样的问题，但数据存到数据库，偏移量保存到kafka是无法实现原子操作的，而如果把数据存储到数据库中，偏移量也存储到数据库中，这样就可以利用数据库的事务来把这两个操作设为一个原子操作...* 下一次调用 poll() 就会在本次设置的偏移量上加1，开始处理没有处理过的数据 * 如果seek()发生错误，比如偏移量不存在，则会抛出异常 */ consumer.poll(0); for

5.7K4 1

Kafka Zero-Copy 使用分析

之前有听过Zero-Copy 技术，而Kafka是典型的使用者。网上找了找，竟然没有找到合适的介绍文章。正好这段时间正在阅读Kafka的相关代码，于是有了这篇内容。...包含两部分： Kafka在什么场景下用了这个技术 Zero-Copy 是如何被调用，并且发挥作用的。...Kafka在什么场景下使用该技术答案是: 消息消费的时候包括外部Consumer以及Follower 从partiton Leader同步数据，都是如此。...那么这个方法什么时候被调用呢？我们先搁置下，因为那个是另外一个流程。我们继续分析上面的代码。...Kafka还有一个非常优秀的机制就是DelayQueue机制，我们在分析的过程中，为了方便，把这块完全给抹掉了。

1.2K3 0

聊聊storm-kafka-client的ProcessingGuarantee

消息，poll拉取消息之后判断如果是ProcessingGuarantee.AT_MOST_ONCE类型的，则调用kafkaConsumer.commitSync同步提交，然后返回拉取的记录(最后设置到...partitions，针对这些partitions，先pause再调用poll，最后再resume，也就是此次poll不会从pausedPartitions拉取消息在poll消息之后还有一个动作就是调用...回调，然后从emitted中删除 KafkaSpoutRetryExponentialBackoff.schedule storm-kafka-client-1.2.2-sources.jar!...false，表示不再调度了，之后KafkaSpout在fail方法回调tupleListener.onMaxRetryReached方法，然后进行ack，表示不再处理了没有超过maxRetries的话...ProcessingGuarantee.AT_MOST_ONCE是在pollKafkaBroker方法里头，在调用完kafkaConsumer.poll之后，调用kafkaConsumer.commitSync

1.4K2 0

【云原生进阶之PaaS中间件】第三章Kafka-4.4-消费者工作流程

3、提交偏移量当我们调用 poll 方法的时候， broker 返回的是生产者写入 Kafka 但是还没有被消费者读取过的记录，消费者可以使用 Kafka 来追踪消息在分区里的位置，我们称之为偏移量...Kafka 但是还没有被消费者读取过的记录，消费者可以使用此记录来追踪消息在分区里的位置，我们称之为偏移量。...假设我们仍然使用默认的 5s 提交时间间隔 , 在最近一次提交之后的 3s 发生了再均衡，再均衡之后 , 消费者从最后一次提交的偏移量位置开始读取消息。...这个时候如果发生再均衡 , 就会出现重复消息。 commitAsync() 也支持回调 , 在 broker 作出响应时会执行回调。回调经常被用于记录提交错误或生成度量指标。...现在的问题是: 如果偏移量是保存在数据库里而不是 Kafka 里 , 那么消费者在得到新分区时怎么知道该从哪里开始读取 ? 这个时候可以使用 seek() 方法。

1821 0

Kafka基础篇学习笔记整理

这种情况是可能出现的，在达到了retries上限或delivery.timeout.ms上限之后，消息发送重试了多次，仍然没有发送成功。...等待异常通过人为干预的方式解除之后，再重新发往kafka。如果消息数据是用户网页点击量、商品阅读量这类的数据，数据量大、对于数据处理延时也没有太多的要求，甚至在异常情况下出现数据丢失也不是不能容忍。...因此，如果消息在多个分区中具有相同的键，那么它们在每个分区中都将被视为不同的消息，无法实现全局的幂等性。 ---- kafka实现事务 kafka幂等性解决的是同一个消息被发送多次，发送至同一个分区。...为了能够使生产者能够感知到消息是否真的发送成功了，有两种方式：同步发送异步发送 + 回调函数添加回调函数写法如下: @Test void testAsyncWithCallBack(...如果你正在使用消息队列，那么我建议你考虑在设计时考虑毒丸消息的使用。确保你的消费者能够识别和正确处理毒丸消息，并在必要时能够停止消费并退出队列。

3.7K2 1

Kafka 消费者

对于上面的例子，假如我们新增了一个新的消费组G2，而这个消费组有两个消费者，那么会是这样的在这个场景中，消费组G1和消费组G2都能收到T1主题的全量消息，在逻辑意义上来说它们属于不同的应用。...另外，我们也可以使用正则表达式来匹配多个主题，而且订阅之后如果又有匹配的新主题，那么这个消费组会立即对其进行消费。正则表达式在连接Kafka与其他系统时非常有用。...我们不断调用poll拉取数据，如果停止拉取，那么Kafka会认为此消费者已经死亡并进行重平衡。参数值是一个超时时间，指明线程如果没有数据时等待多长时间，0表示不等待立即返回。...每次发起异步提交时增加此序号，并且将此时的序号作为参数传给回调方法；当消息提交失败回调时，检查参数中的序号值与全局的序号值，如果相等那么可以进行重试提交，否则放弃（因为已经有更新的位移提交了）。...另外注意的是，seek()只是指定了poll()拉取的开始位移，这并不影响在Kafka中保存的提交位移（当然我们可以在seek和poll之后提交位移覆盖）。

2.3K4 1

超200万？约翰斯·霍普金大学数据错误！——谈谈如何保证实时计算数据准确性

这种消息传递的定义叫做消息传递语义：我们要了解的是message delivery semantic 也就是消息传递语义。这是一个通用的概念，也就是消息传递过程中消息传递的保证性。...不丢失不重复就一次那么我们希望能做到精确传递一次（exactly once），虽然可能会付出一些性能的代价。我们从几个常见的流计算框架中，看一看都是如何解决端到端的一致性的问题。...： 0：producer完全不管broker的处理结果回调也就没有用了并不能保证消息成功发送但是这种吞吐量最高 all或者-1：leader broker会等消息写入并且ISR都写入后才会响应...每个dag中的算子遇到这个标记就会触发这个算子状态的快照。 ? 读取kafka的算子，在遇到检查点标记时会存储kafka的offset。之后，会把这个检查点标记传到下一个算子。...在任务运行中的任何阶段失败，都会从上一次的状态恢复，所有没有正式提交的数据也会回滚。 ?

5982 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭