在了解了生产者和消费者的工作方式之后,我们来讨论Kafka在生产者和消费者之间提供的语义保证。 显然,有多个可能的消息专题保证可以提供:
值得注意的是,这会分解成两个问题:发布消息的持久性保证以及消费消息时的保证。 许多系统声称可以提供恰好一次的交付语义,但是阅读细则很重要,这些声明中的大多数具有误导性(即它们不能翻译为消费者或生产者可能失败的情况,有多个消费者进程,或者数据写入磁盘可能失败的情况)。
Kafka的语义很直接。在发布消息时,我们有一个消息被“提交”到日志的概念。一旦提交已经发布的消息,只要把消息复制到分区的broker保持“活动”,它就不会丢失。提交消息的定义,活动分区以及我们尝试处理那些类型的故障的描述将在下一节中详细描述。现在让我们假设一个完美的broker,并且尝试了解对生产者和消费者的保证。如果生产者尝试发布消息并遇到网络错误,则无法确定在提交消息之前或者之后发生了此错误。这类似于使用自动生成的密钥插入数据库表的语义。
在0.11.0.0之前,如果生产者未能收到表明消息已经提交的响应,则除了重新发送请求之外别误选择。这提供了至少一次传递语义,因为如果原始请求实际上请求成功了,则在重新发送期间可以再次将消息写入日志。从0.11.0.0开始,Kafka还支持幂等传递选项,该选项保证重新发送不会在日志中导致重复条目。为了实现这个目的,broker为每个生产者分配一个ID,并使用生产者发送的序列号和每条消息对每条消息进行重复数据删除。