网络编程基础漫谈（三）之 select 函数重难点解析乙篇

文章来源：企鹅号 - 高性能服务器开发

接上一篇《网络编程基础漫谈（三）之 select 函数重难点解析甲篇》。

关于上述代码在实际开发中有几个需要注意的事项，这里逐一来说明一下：

1. select 函数调用前后会修改 readfds、writefds 和 exceptfds 这三个集合中的内容（如果有的话），所以如果您想下次调用 select 复用这个变量，记得在下次调用前再次调用 select 前先使用 FD_ZERO 将集合清零，然后调用 FD_SET 将需要检测事件的 fd 再次添加进去。

select 函数调用之后，readfds、writefds和exceptfds这三个集合中存放的不是我们之前设置进去的 fd，而是有相关有读写或异常事件的 fd，也就是说 select 函数会修改这三个参数的内容，这也要求我们当一个 fd_set 被 select 函数调用后，这个 fd_set 就已经发生了改变，下次如果我们需要使用它，必须使用 FD_ZERO 宏先清零，再重新将我们关心的 fd 设置进去。这点我们从FD_ISSET源码也可以看出来：

如果调用 select 函数之后没有改变 fd_set 集合，那么即使某个 socket 上没有事件，调用 select 函数之后我们用FD_ISSET检测，会原路得到原来设置上去的 socket。这是很多初学者在学习 select 函数容易犯的一个错误，我们通过一个示例来验证一下，这次我们把 select 函数用在客户端。

在 shell 窗口输入以下命令编译程序产生可执行文件select_client：

这次产生的是客户端程序，服务器程序我们这里使用 Linuxnc命令来模拟一下，由于客户端连接的是127.0.0.1:3000这个地址和端口号，所以我们在另外一个shell 窗口的nc命令的参数可以这么写：

执行效果如下：接着我们启动客户端select_client：

需要注意的是，这里我故意将客户端代码中 select 函数的超时时间设置为5秒，以足够我们在这 5 秒内给客户端发一个数据。如果我们在 5 秒内给客户端发送hello字符串：

客户端输出如下：

除了第一次select_client会输出equal字样，后面再也没输出，而select函数以后的执行结果也是超时，即使此时服务器端再次给客户端发送数据。因此验证了：select 函数执行后，确实会对三个参数的 fd_set 进行修改。select函数修改某个 fd_set 集合可以使用如下两张图来说明一下：

因此在调用select函数以后，原来位置的的标志位可能已经不复存在，这也就是为什么我们的代码中调用一次select函数以后，即使服务器端再次发送数据过来，select函数也不会再因为存在可读事件而返回了，因为第二次 clientfd 已经不在那个 read_set 中了。因此如果复用这些 fd_set 变量，必须按上文所说的重新清零再重新添加关心的 socket 到集合中去。

2. select 函数也会修改 timeval 结构体的值，这也要求我们如果像复用这个变量，必须给 timeval 变量重新设置值。

注意观察上面的例子的输出，我们在调用select函数一次之后，变量 tv 的值也被修改了。具体修改成多少，得看系统的表现。当然这种特性却不是跨平台的，在 Linux 系统中是这样的，而在其他操作系统上却不一定是这样（Windows 上就不会修改这个结构体的值），这点在 Linux man 手册select函数的说明中说的很清楚：

由于不同系统的实现不一样，man 手册的建议将select函数修改timeval结构体的值的行为当作是未定义的，言下之意是如果你要下次使用 select 函数复用这个变量时，记得重新赋值。这是 select 函数需要注意的第二个地方。

3. select 函数的 timeval 结构体的 tv_sec 和 tv_sec 如果两个值设置为 0，即检测事件总时间设置为0，其行为是 select 会检测一下相关集合中的 fd，如果没有需要的事件，则立即返回。

我们将上述select_client.cpp修改一下，修改后的代码如下：

执行结果确实如我们预期的，这里 select 函数只是简单地检测一下 clientfd，并不会等待固定的时间，然后立即返回。

4. 如果将 select 函数的 timeval 参数设置为 NULL，则 select 函数会一直阻塞下去，直到我们需要的事件触发。

我们将上述代码再修改一下：

我们先在另外一个 shell 窗口用nc命令模拟一个服务器，监听的 ip 地址和端口号是0.0.0.0:3000：

然后回到原来的 shell 窗口，编译上述select_client_tvnull.cpp，并使用 gdb 运行程序，这次使用 gdb 运行程序的目的是为了当程序“卡”在某个位置时，我们可以使用 Ctrl + C 把程序中断下来看看程序阻塞在哪个函数调用处：

如上输出结果所示，我们使用 gdb 的r命令（run）将程序跑起来后，程序卡在某个地方，我们按 Ctrl + C（代码中的^C）中断程序后使用bt命令查看当前程序的调用堆栈，发现确实阻塞在select函数调用处；接着我们在服务器端给客户端发送一个hello数据：

客户端收到数据后，select函数满足条件，立即返回，并将数据输出来后继续进行下一轮select检测，我们使用 Ctrl + C 将程序中断，发现程序又阻塞在select调用处；输入c命令（continue）让程序继续运行，此时，我们再用服务器端给客户端发送world字符串，select函数再次返回，并将数据打印出来，然后继续进入下一轮 select 检测，并继续在 select 处阻塞。

5. 在 Linux 平台上，select 函数的第一个参数必须设置成需要检测事件的所有 fd 中的最大值加1。所以上文中select_server.cpp中，每新产生一个 clientfd，我都会与当前最大的maxfd作比较，如果大于当前的maxfd则将maxfd更新成这个新的最大值。其最终目的是为了在select调用时作为第一个参数（加 1）传进去。

在 Windows 平台上，select 函数的第一个值传任意值都可以，Windows 系统本身不使用这个值，只是为了兼容性而保留了这个参数，但是在实际开发中为了兼容跨平台代码，也会按惯例，将这个值设置为最大 socket 加 1。这点请读者注意。

以上是我总结的 Linux 下 select 使用的五个注意事项，希望读者能理解它们。

发表于: 2018-12-252018-12-25 08:00:30
原文链接：https://kuaibao.qq.com/s/20181225G06NA600?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

网络编程基础漫谈（三）之 select 函数重难点解析乙篇

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

网络编程基础漫谈（三）之 select 函数重难点解析 乙篇

相关快讯

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

网络编程基础漫谈（三）之 select 函数重难点解析乙篇