文章/答案/技术大牛

发布

Netty（三）什么是 TCP 拆、粘包？如何解决？

文章来源：企鹅号 - crossoverJie

前言

记得前段时间我们生产上的一个网关出现了故障。

这个网关逻辑非常简单，就是接收客户端的请求然后解析报文最后发送短信。

但这个请求并不是常见的 HTTP ，而是利用 Netty 自定义的协议。

有个前提是：网关是需要读取一段完整的报文才能进行后面的逻辑。

问题是有天突然发现网关解析报文出错，查看了客户端的发送日志也没发现问题，最后通过日志发现收到了许多不完整的报文，有些还多了。

于是想会不会是 TCP 拆、粘包带来的问题，最后利用 Netty 自带的拆包工具解决了该问题。

这便有了此文。

TCP 协议

问题虽然解决了，但还是得想想原因，为啥会这样？打破砂锅问到底才是一个靠谱的程序员。

这就得从 TCP 这个协议说起了。

TCP 是一个面向字节流的协议，它是性质是流式的，所以它并没有分段。就像水流一样，你没法知道什么时候开始，什么时候结束。

所以他会根据当前的套接字缓冲区的情况进行拆包或是粘包。

下图展示了一个 TCP 协议传输的过程：

发送端的字节流都会先传入缓冲区，再通过网络传入到接收端的缓冲区中，最终由接收端获取。

当我们发送两个完整包到接收端的时候：

正常情况会接收到两个完整的报文。

但也有以下的情况：

接收到的是一个报文，它是由发送的两个报文组成的，这样对于应用程序来说就很难处理了（这样称为粘包）。

还有可能出现上面这样的虽然收到了两个包，但是里面的内容却是互相包含，对于应用来说依然无法解析（拆包）。

对于这样的问题只能通过上层的应用来解决，常见的方式有：

在报文末尾增加换行符表明一条完整的消息，这样在接收端可以根据这个换行符来判断消息是否完整。

将消息分为消息头、消息体。可以在消息头中声明消息的长度，根据这个长度来获取报文（比如 808 协议）。

规定好报文长度，不足的空位补齐，取的时候按照长度截取即可。

以上的这些方式我们在 Netty 的 pipline 中里加入对应的解码器都可以手动实现。

但其实 Netty 已经帮我们做好了，完全可以开箱即用。

比如：

可以基于换行符解决。

可基于分隔符解决。

可指定长度解决。

字符串拆、粘包

下面来模拟一下最简单的字符串传输。

还是在之前的

https://github.com/crossoverJie/netty-action

进行演示。

在 Netty 客户端中加了一个入口可以循环发送 100 条字符串报文到接收端：

服务端直接打印即可：

顺便提一下，这里加的有一个字符串的解码器：其实就是把消息解析为字符串。

在 Swagger 中调用了客户端的接口用于给服务端发送了 100 次消息：

正常情况下接收端应该打印 100 次才对，但是查看日志会发现：

收到的内容有完整的、多的、少的、拼接的；这也就对应了上面提到的拆包、粘包。

该怎么解决呢？这便可采用之前提到的利用换行符解决。

利用 LineBasedFrameDecoder 解决问题

解码器使用非常简单，只需要在 pipline 链条上添加即可。

构造函数中传入了 1024 是指报的长度最大不超过这个值，具体可以看下文的源码分析。

然后我们再进行一次测试看看结果：

注意，由于 LineBasedFrameDecoder 解码器是通过换行符来判断的，所以在发送时，一条完整的消息需要加上。

最终的结果：

仔细观察日志，发现确实没有一条被拆、粘包。

LineBasedFrameDecoder 的原理

目的达到了，来看看它的实现原理：

第一步主要就是方法去找到当前报文中是否存在分隔符，存在就会返回分隔符所在的位置。

判断是否需要丢弃，默认为 false ，第一次走这个逻辑（下文会判断是否需要改为 true）。

如果报文中存在换行符，就会将数据截取到那个位置。

如果不存在换行符（有可能是拆包、粘包），就看当前报文的长度是否大于预设的长度。大于则需要缓存这个报文长度，并将 discarding 设为 true。

如果是需要丢弃时，判断是否找到了换行符，存在则需要丢弃掉之前记录的长度然后截取数据。

如果没有找到换行符，则将之前缓存的报文长度进行累加，用于下次抛弃。

从这个逻辑中可以看出就是寻找报文中是否包含换行符，并进行相应的截取。

由于是通过缓冲区读取的，所以即使这次没有换行符的数据，只要下一次的报文存在换行符，上一轮的数据也不会丢。

高效的编码方式 Google Protocol

上面提到的其实就是在解码中进行操作，我们也可以自定义自己的拆、粘包工具。

编解码的主要目的就是为了可以编码成字节流用于在网络中传输、持久化存储。

Java 中也可以实现 Serializable 接口来实现序列化，但由于它性能等原因在一些 RPC 调用中用的很少。

而则是一个高效的序列化框架，下面来演示在 Netty 中如何使用。

安装

首先第一步自然是安装：

在官网下载对应的包。

本地配置环境变量：

当执行出现以下结果表明安装成功：

定义自己的协议格式

接着是需要按照官方要求的语法定义自己的协议格式。

比如我这里需要定义一个输入输出的报文格式：

BaseRequestProto.proto:

BaseResponseProto.proto:

再通过

protoc 命令将刚才定义的协议格式转换为 Java 代码，并生成在目录。

只需要将生成的代码拷贝到我们的项目中，同时引入依赖：

利用 Protocol 的编解码也非常简单：

利用来做一个演示，先编码再解码最后比较最终的结果是否相同。答案肯定是一致的。

利用 protoc 命令生成的 Java 文件里已经帮我们把编解码全部都封装好了，只需要简单调用就行了。

发表于: 2018-08-062018-08-06 08:35:03
原文链接：https://kuaibao.qq.com/s/20180806G09XEB00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

Netty（三）什么是 TCP 拆、粘包？如何解决？

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐