Linux内核将所有的外部设备当做一个文件来操作,对文件的读写操作会调用内核的系统命令,返回一个文件描述符(file descriptor,fd)。而对socket的读写也有相应的描述符,称为socketfd。描述符就是一个数字,指向内存中的一个结构体(文件路径或者数据区等)
操作系统5中IO模型
(1)阻塞IO模型
阻塞IO模型:在应用进程中调用recvfrom,期间系统调用直到数据包到达并被复制到应用进程的缓冲区中或者发生异常而返回,期间会一直等待,应用进程从调用recvfrom开始到返回的整个时间段内都是阻塞的。
(2)非阻塞IO模型
非阻塞IO模型:在应用进程中调用recvfrom,如果内核没有数据,直接返回一个EWOULDBLOCK错误,非阻塞IO模型轮询这个EWOULDBLOCK状态,判断是否有数据到来。
(3)IO复用模型
IO复用模型:Linux提供select/poll,应用进程将一个或多个fd传递给select/poll系统调用,阻塞在select/poll操作上,select/poll帮助应用进程监听fd是否处于就绪状态。select/poll是顺序扫描fd的状态,且支持的fd数量有限。因此Linux还提供了epoll系统调用,epoll基于事件驱动代替顺序扫描,性能更高,当有fd就绪时,立即回调函数。Java NIO中的核心类库Selector是基于epoll的IO复用技术实现的。
(4)信号驱动IO模型
信号驱动IO模型:应用进程调用sigaction执行一个信号处理函数(非阻塞),之后立刻返回,应用进程继续工作。当数据准备就绪时,为改进程生成一个SIGIO信号,通过信号回调通知应用进程调用recvfrom来内核取回数据。
(5)异步IO模型
异步IO模型:应用进程告知内核启动某个操作,并让内核在整个操作完成后(包括内核处理和数据从内核复制到应用进程缓冲区),通知应用进程。
异步IO模型与信号驱动IO模型的区别:信号驱动IO模型由内核通知应用进程何时可以开始一个IO操作;异步IO模型由内核通知应用进程IO操作何时完成。