客户端常见报错与解决方案

最近更新时间:2022-02-18 16:38:16

我的收藏

客户端配置或服务异常

以下异常属于客户端配置或服务异常,客户端不会自动重试。
异常
描述
分析与说明
UnknownServerException
服务器处理请求发生未知错误。
老版本流控会返回这个错误;新版本则可能是服务器出现 BUG 导致。
RecordTooLargeException
消息太大。
目前配置 message.max.bytes=1000012。
InvalidRequiredAcksException
生产者配置的 acks 参数不合法。
-
InconsistentGroupProtocolException
Group 的协议不一致。
检查 Consumer 和 Connector 是否配置了相同的 group.id,这两者使用的不同的协议,不能加入相同的组。
InvalidGroupIdException
Consumer Group ID不合法。
建议使用 [a-zA-Z0-9._-] 这些字符,长度不超过 128。
InvalidTopicException
Topic 不合法。
开启自动创建 Topic 选项后,客户端使用的 Topic 不合法会返回这个异常。检查 Topic 是否使用了不合法的字符或长度是否超过限制。
InvalidSessionTimeoutException
消费者配置的 session.timeout.ms 不合法。
目前服务器端允许的最小值为:group.min.session.timeout.ms=6000,最大值为:group.max.session.timeout.ms=300000。
InvalidCommitOffsetSizeException
提交 Offset 信息太大超过最大消息大小,无法写入__consumer_offsets。
目前配置 message.max.bytes=1000012。
OffsetMetadataTooLarge
Offset 提交请求包含的 Metadata 太大。
服务器配置的 offset.metadata.max.bytes=4096。
UnsupportedVersionException
Broker 不支持该版本的请求。
建议使用 0.10.2.x 版本的客户端。

程序正常运行时的短暂异常

以下异常在程序正常运行过程中可能会短暂出现,客户端会自动重试。 持续出现则服务不正常。
异常
描述
分析与说明
TimeoutException
请求超时。
首次连接报请求超时,先检查地址是否正确,telnet 确定网络能够联通。程序运行中偶尔抛出此异常可能属于网络抖动。
CorruptRecordException
消息不合法。
可能 CRC 检查不通过,数据大小不合法。此外,如果压缩方式使用 GZip 或 0.9 以下版本 使用压缩 也会导致这个错误。
UnknownTopicOrPartitionException
Topic 或 Partition 不存在。
到控制台检查是否已经创建对应的 Topic。注意:客户端通过TopicName生产消费,而不是TopicId。此外,客户端没有权限访问 Topic 时也会报 Topic 不存在。
LeaderNotAvailableException
Partition 没有 Leader。
当 Topic 刚创建时服务器还未选出合适的 Leader,此时会返回此错误给客户端,客户端会自动重试获取 Leader信息。旧版本才会有这个异常,0.10.2.1 已经去掉
NotLeaderForPartitionException
Partition 的 Leader 不可用。
由于客户端会缓存 Topic 的 Metadata,所以当 Partition 的 Leader 切换 时,生产或消费请求可能仍然发送到旧 Leader 上,此时会返回此错误给客户端,客户端会自动更新 Metadata 信息。
NetworkException
客户端连接被服务器端关闭。
网络异常或连接数超过限制。
NotEnoughReplicasException
ISR 数量不够。
在写入数据时 Partition 的 ISR 数量小于 Topic 配置的 min.insync.replicas,可能由于 ISR 抖动导致。
NotEnoughReplicasAfterAppendException
数据写入 Broker 本地后,发生 ISR 抖动导致无法满足 min.insync.replicas。
-
BrokerNotAvailableError
未找到该分区的 Leader。
由于客户端会缓存 Topic 的 Metadata,所以当 Partition 的 Leader 切换 时,生产或消费请求可能仍然发送到旧 Leader 上,此时会返回该错误给客户端。客户端会自动更新 Metadata 信息,在 Leader 切换后,新生产的请求发送到老的 Leader 报错应该后会自动调整到新的 Leader 上,理论上不会影响数据写入消费的完整性。
NotLeaderForPartitionError
未找到该分区的 Leader。
由于客户端会缓存 Topic 的 Metadata,所以当 Partition 的 Leader 切换 时,生产或消费请求可能仍然发送到旧 Leader 上,此时会返回此错误给客户端,客户端会自动更新 Metadata 信息,在 Leader 切换后,新生产的请求发送到老的 Leader 报错应该后会自动调整到新的 Leader 上,理论上不会影响数据写入消费的完整性。

日志配置为 DEBUG 级别时异常

以下异常在日志配置为 DEBUG 级别会出现,客户端会自动处理。
异常
描述
分析与说明
OffsetOutOfRangeException
消费者拉取消息时传入的 Offset 超出范围。
如果客户端设置了 Offset 重置策略(earliest 或 latest),则客户端会根据策略进行 Offset 重置,否则需要用户程序处理这个异常
GroupLoadInProgressException
ConsumerGroup 对应的 Coordinator正在加载。
服务器端升级时可能短暂出现,客户端会自动重试。
GroupCoordinatorNotAvailableException
Coordinator 不可用。
服务器端升级时可能短暂出现,客户端会自动重试。
NotCoordinatorForGroupException
当前节点不是该 ConsumerGroup的Coordinator,Coordinator 迁移到别的节点。
服务器端升级时可能短暂出现,客户端会自动重试。
IllegalGenerationException
ConsumerGroup 的 generation不合法。
可能心跳超时或有新消费者加入,Consumer 会自动重新尝试加入 ConsumerGroup。
RebalanceInProgressException
ConsumerGroup 正在进行 rebalance。
可能心跳超时或有新消费者加入,Consumer 会自动重新尝试加入 ConsumerGroup。