阻塞/非阻塞读写总结、tcp网络编程的本质、muduo::Buffer设计简介

一、阻塞/非阻塞读写总结

1、对于read 调用,如果接收缓冲区中有 20字节,请求读 100个字节,就会返回 20;对于 write调用,如果请求写 100个字节,而发送缓冲区中只有 20个字节的空闲位置,那么 write会阻塞,直到把 100个字节全部交给发送缓冲区才返回。但如果 socket文件描述符有 O_NONBLOCK标志,则 write不阻塞,直接返回 20;此时非阻塞地read 也直接返回20。

2、read 没有一点数据可读或 write 没有一点空间可以写入,如果disable O_NONBLOCK 则会阻塞,如果enable O_NONBLOCK 则会返回-1,errno = EAGAIN | EWOULDBLOCK 错误。

3、阻塞模式下可以用setsockopt设置SO_RCVTIMEO(超时时间),即如果在超时时间内接收缓冲区都没有一点数据到来,那么返回-1,errno = EAGAIN | EWOULDBLOCK 错误。同理,还有SO_SNDTIMEO 选项,在超时时间内发送缓冲区都没有足够内存存放数据,也是返回-1,errno = EAGAIN | EWOULDBLOCK 错误。

4、recv的第四个参数若为MSG_WAITALL,则在阻塞模式下不等到指定数目的数据不会返回,除非超时时间到。当然如果对方关闭了,即使超时时间未到,recv 也返回0。/usr/include/i386-linux-gnu/bits/socket.h     MSG_WAITALL = 0x100

5、在多线程环境中,某个线程的阻塞不会引起进程的阻塞,除非进程中的所有线程都被阻塞。(pthread)

二、TCP网络编程的本质

TCP网络编程最本质是的处理三个半事件(来自:muduo manual.pdf)

1. 连接的建立,包括服务端接受(accept) 新连接和客户端成功发起(connect) 连接。TCP 连接一旦建立,客户端和服务端是平等的,可以各自收发数据。 2. 连接的断开,包括主动断开(close 或shutdown) 和被动断开(read(2) 返回0)。 3. 消息到达,文件描述符可读。这是最为重要的一个事件,对它的处理方式决定了网络编程的风格(阻塞还是非阻塞,如何处理分包,应用层的缓冲如何设计等等)。 3.5 消息发送完毕,这算半个。对于低流量的服务,可以不必关心这个事件;另外,这里“发送完毕”是指将数据写入操作系统的缓冲区,将由TCP 协议栈负责数据的发送与重传,不代表对方已经收到数据。

1、下图是根据muduo库中对读写事件的处理画出的草图:

2、Echoser 类图:(muduo/example/simple/Echo.h、Echo.cc)

使用基于对象风格实现,详见这里

3、什么都不做的EventLoop

one loop per thread意思是说每个线程最多只能有一个EventLoop对象,这种线程即“reactor"(mainReactor & subReactor)。剩下一些存在于threadpool 的线程主要用于做计算(decode, compute, encode),并不是IO线程。

EventLoop对象构造的时候,会检查当前线程是否已经创建了其他EventLoop对象,如果已创建,终止程序(LOG_FATAL)

EventLoop构造函数会记住本对象所属线程(threadId_)。

创建了EventLoop对象的线程称为IO线程,其功能是运行事件循环(EventLoop::loop)

三、muduo::Buffer设计简介

所有muduo 中的IO 都是带缓冲的IO (buffered IO),你不会自己去read() 或write() 某个socket,只会操作TcpConnection 的input buffer 和output buffer。更确切的说,是在onMessage() 回调里读取input buffer;调用TcpConnection::send()来间接操作output buffer,一般不会直接操作output buffer。

TcpConnection 会有两个Buffer 成员,input buffer 与output buffer。

• input buffer,TcpConnection 会从socket 读取数据,然后写入input buffer(其实这一步是用Buffer::readFd() 完成的);客户代码从input buffer 读取数据。

• output buffer,客户代码会把数据写入output buffer (其实这一步是用TcpConnection::send() 完成的);TcpConnection 从output buffer 读取数据并写入socket。

其实,input 和output 是针对客户代码而言,客户代码从input 读,往output 写。TcpConnection 的读写正好相反。

两个indices 把vector 的内容分为三块:prependable、readable、writable,各块的大小是(公式一):

prependable = readIndex

readable = writeIndex - readIndex

writable = size() - writeIndex

Muduo Buffer 里有两个常数kCheapPrepend 和kInitialSize,定义了prependable的初始大小和writable 的初始大小,readable 的初始大小为0。在初始化之后,Buffer 的数据结构如下:括号里的数字是该变量或常量的值。

关于Buffer::readFd():

// 结合栈上的空间,避免内存使用过大,提高内存使用率
// 如果有5K个连接,每个连接就分配64K+64K的缓冲区的话,将占用640M内存,
// 而大多数时候,这些缓冲区的使用率很低
ssize_t Buffer::readFd(int fd, int *savedErrno)
{
    // saved an ioctl()/FIONREAD call to tell how much to read
    // 节省一次ioctl系统调用(获取有多少可读数据)
    char extrabuf[65536];
    struct iovec vec[2];
    const size_t writable = writableBytes();
    // 第一块缓冲区
    vec[0].iov_base = begin() + writerIndex_;
    vec[0].iov_len = writable;
    // 第二块缓冲区
    vec[1].iov_base = extrabuf;
    vec[1].iov_len = sizeof extrabuf;
    const ssize_t n = sockets::readv(fd, vec, 2);
    if (n < 0)
    {
        *savedErrno = errno;
    }
    else if (implicit_cast<size_t>(n) <= writable)  //第一块缓冲区足够容纳
    {
        writerIndex_ += n;
    }
    else        // 当前缓冲区,不够容纳,因而数据被接收到了第二块缓冲区extrabuf,将其append至buffer
    {
        writerIndex_ = buffer_.size();
        append(extrabuf, n - writable);
    }
    // if (n == writable + sizeof extrabuf)
    // {
    //   goto line_30;
    // }
    return n;
}

具体做法是,在栈上准备一个65536 字节的stackbuf,然后利用readv() 来读取数据,iovec 有两块,第一块指向muduo Buffer 中的writable 字节,另一块指向栈上的stackbuf。这样如果读入的数据不多,那么全部都读到Buffer 中去了;如果长度超过Buffer 的writable 字节数,就会读到栈上的stackbuf 里,然后程序再把stackbuf 里的数据append 到Buffer 中。

参考:

《UNP》

muduo manual.pdf

《linux 多线程服务器编程:使用muduo c++网络库》

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏分布式系统和大数据处理

.Net Remoting(基本操作) - Part.2

接下来我们考虑通常的情况,也就是 客户程序 与 宿主程序 位于不同的进程中的情况。

612
来自专栏Golang语言社区

运行时调度程序(go runtime scheduler)

Goroutine的引入是为了方便高并发程序的编写。 一个Goroutine在进行阻塞操作(比如系统调用)时,会把当前线程中的其他Goroutin...

682
来自专栏大内老A

WCF技术剖析之十一:异步操作在WCF中的应用(下篇)

说完了客户端的异步服务调用(参阅WCF技术剖析之十一:异步操作在WCF中的应用(上篇)),我们在来谈谈服务端如何通过异步的方式为服务提供实现。在定义服务契约的时...

1909
来自专栏张善友的专栏

Mono 3.0.2 基于双工通信的WCF应用 Demo

双工(Duplex)模式的消息交换方式体现在消息交换过程中,参与的双方均可以向对方发送消息。基于双工MEP消息交换可以看成是多个基本模式下(比如请求-回复模式和...

1776
来自专栏用户2442861的专栏

基于protobuf的RPC实现

http://blog.csdn.net/kevinlynx/article/details/39379957

523
来自专栏JetpropelledSnake

Python Web学习笔记之多线程编程

本次给大家介绍Python的多线程编程,标题如下: Python多线程简介 Python多线程之threading模块 Python多线程之Lock线程锁 Py...

2868
来自专栏匠心独运的博客

消息中间件—RocketMQ消息存储(二)一、RocketMQ存储整体设计架构回顾二、RocketMQ存储关键技术—再谈Mmap与PageCache三、RocketMQ存储优化技术四、RocketMQ

文章摘要:上篇中主要介绍了RocketMQ存储部分的整体架构设计,本篇将深入分析RocketMQ存储部分的细节内容 在本篇文章中,小编将继续深入分析与介绍Ro...

352
来自专栏Golang语言社区

GO语言高并发学习心得体会例

信号 sigRecv1:=make(chan os.Signal,1)sigs1:=[]os.Signal{syscall.SIGINT,syscall.SIG...

2945
来自专栏直播开发

SRS开源直播服务 - StateThreads微线程框架学习

SRS是一个开源流媒体服务器,在目前大火的直播行业中较多的被使用。笔者作为直播行业的后台开发,对SRS的学习必不可少,本文主要讲解SRS底层使用的微线程开源...

1382
来自专栏散尽浮华

Python-操作Memcache、Redis、RabbitMQ、

Memcache 简述:      Memcache是一套分布式的高速缓存系统,由LiveJournal的Brad Fitzpatrick开发,但目前被许多网站...

2307

扫码关注云+社区