本篇是第四篇,用来介绍一种高效的多路复用方法epoll,它是在select的基础上,针对select的缺点再次设计的处理方法。
一、select的缺点以及epoll的解决策略
1. select低效的原因之一:是将“维护等待队列”和“阻塞进程”两个步骤合二为一,epoll将这两个操作拆分开来,如此以来,可以让单次操作变小,而这种操作导致的阻塞时间和冲突变少。
select这种方式会让阻塞时间和阻塞冲突的机会变大,因为只要是“添加等待队列”和“阻塞”只要有一个冲突,就会冲突。
备注:epoll将这两个操作分开,先用epoll_ctl维护等待队列,再调用epoll_wait阻塞进程。
2.select低效的另一个原因:在于程序不知道哪些socket收到数据,只能一个个遍历。epoll维护一个“就绪列表”,引用收到数据的socket,就能避免遍历。
过程:
1. 收到数据的sock2和sock3被rdlist(就绪列表)所引用。
2. 当进程被唤醒后,只要获取rdlist的内容,就能够知道哪些socket收到数据。
二、epoll的处理过程
epoll的设计主要是三个函数,epoll_create, epoll_ctl和epoll_wait,功能介绍如下代码注释所示:
int s = socket(AF_INET, SOCK_STREAM, 0);
bind(s, ...)
listen(s, ...)
// 创建一个epoll的fd用来管理多个socket
int epfd = epoll_create(...);
// 将所有需要监听的socket添加到epfd中,这里原本应该是一个循环,不过没写出来
epoll_ctl(epfd, ...);
while(1){
// 这里监控socket有没有数据收到
int n = epoll_wait(...)
for(接收到数据的socket){
//处理
}
}
2. 利用 epoll_ctl添加或删除所要监听的socket,进行维护监视列表
备注:当socket收到数据后,中断程序会操作eventpoll对象,而不是直接操作进程。
3. 接收数据
eventpoll对象相当于是socket和进程之间的中介,socket的数据接收并不直接影响进程,而是通过改变eventpoll的就绪列表来改变进程状态。当程序执行到epoll_wait时,如果rdlist已经引用了socket,那么epoll_wait直接返回,如果rdlist为空,阻塞进程。
4. 阻塞进程
正在运行进程A和进程B,在某时刻进程A运行到了epoll_wait语句。内核会将进程A放入eventpoll的等待队列中,阻塞进程。
5.唤醒进程
当socket接收到数据,中断程序一方面修改rdlist,另一方面唤醒eventpoll等待队列中的进程,进程A再次进入运行状态(如下图)。也因为rdlist的存在,进程A可以知道哪些socket发生了变化。
综述,通过上面的介绍,我们知道epoll通过两个关键点来实现这种高效的操作,一种是:解耦合的方式,将等待队列和阻塞两个操作拆分开来。一种是:增加等待队列的方式,来记录那些需要进行响应的socket信息,进而来提高多路复用的效率。
参看资料:
https://mp.weixin.qq.com/s/yB_GimOPl6o4VB85Wlh1dQ
https://zhuanlan.zhihu.com/p/64138532