首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

最全Go select底层原理,一文学透高频用法

导语 |在日常开发中,select语句被高频使用。但目前,全网分析select在编译期和运行时的完整底层原理资料,非常匮乏。本文基于Go1.18.1版本的源码,讲解select访问Channel在编译期和运行时的底层原理——select编译器优化用到的src/cmd/compile/internal/walk/select.go的walkSelectCases()函数和多case情况下运行时用到的runtime.selectgo()函数。希望能帮助到各位开发者。

在对Channel的读写方式上,除了我们通用的读 i

在日常开发中,select语句还是会经常用到的。可能是channel普通读写的使用频率比select高,网上关于Channel源码的分析文章很多,关于select用法的文章也很多,select运行时的selectgo函数的分析也有一些,但是关于select在编译期和运行时的完整的底层原理的分析文章并不多。

本文的分析基于Go1.18.1版本的源码,主要分析select编译器优化用到的src/cmd/compile/internal/walk/select.go的walkSelectCases()函数和多case情况下运行时用到的 runtime.selectgo()函数。

结论先行

第一,Go select语句采用的多路复用思想,本质上是为了达到通过一个协程同时处理多个IO请求(Channel读写事件)。

第二,select的基本用法是:通过多个case监听多个Channel的读写操作,任何一个case可以执行则选择该case执行,否则执行default。如果没有default,且所有的case均不能执行,则当前的goroutine阻塞。

第三,编译器会对select有不同的case的情况进行优化以提高性能。首先,编译器对select没有case、有单case和单case+default的情况进行单独处理。这些处理或者直接调用运行时函数,或者直接转成对channel的操作,或者以非阻塞的方式访问channel,多种灵活的处理方式能够提高性能,尤其是避免对channel的加锁。

第四,对最常出现的select有多case的情况,会调用 runtime.selectgo() 函数来获取执行 case 的索引,并生成 if 语句执行该case的代码。

第五,selectgo函数的执行分为四个步骤:首先,随机生成一个遍历case的轮询顺序 pollorder 并根据 channel 地址生成加锁顺序 lockorder,随机顺序能够避免channel饥饿,保证公平性,加锁顺序能够避免死锁;然后,根据 pollorder 的顺序查找 scases 是否有可以立即收发的channel,如果有则获取case索引进行处理;再次,如果pollorder顺序上没有可以直接处理的case,则将当前 goroutine 加入各 case 的 channel 对应的收发队列上并等待其他 goroutine 的唤醒;最后,当调度器唤醒当前 goroutine 时,会再次按照 lockorder 遍历所有的case,从中查找需要被处理的case索引进行读写处理,同时从所有case的发送接收队列中移除掉当前goroutine。

select是什么?怎么用?

select是Go在语言层面提供的I/O多路复用的机制,其专门用来检测多个channel是否准备完毕:可读或可写。

1)什么是IO多路复用?

我们一看到select,就知道它原本是Linux操作系统中的系统调用。操作系统提供 select、poll 和 epoll 等函数构建 I/O 多路复用模型提升程序处理IO事件如网络请求的性能。Go 语言的 select 与操作系统中的 select 比较相似但又不完全相同。

操作系统中IO多路复用中多路就是多个TCP连接,复用就是指复用一个或少量线程,理解起来就是多个网络连接的IO事件复用一个或少量线程来处理这些连接。一句话概括就是,IO多路复用就是复用一个线程处理多个IO请求

普通多线程IO 如图1.1所示,每来一个IO事件,比如网络读写请求事件,操作系统都会起一个线程或进程进行处理。这种方式的缺点很明显:对多个IO事件,系统需要创建和维护对应的多个线程或进程。大多数时候,大部分IO事件是处于等待状态,只有少部分会立即操作完成,这会导致对应的处理线程大部分时候处于等待状态,系统为此还需要多做很多额外的线程或者进程的管理工作。

图1.1 普通多线程IO

IO多路复用的基本原理如图1.2所示。通过复用可以使一个线程处理多个IO事件。操作系统无需对额外的多个线程或者进程进行管理,节约了资源,提升了效率。

图1.2 IO多路复用

操作系统中实现IO多路复用的命令select、poll、epoll,主要通过起一个线程来监听并处理多个文件描述符代表的TCP链接,用来提高处理网络读写请求的效率。而Go语言的select命令,是用来起一个goroutine协程监听多个Channel(代表多个goroutine)的读写事件,提高从多个Channel获取信息的效率。二者具体目标和实现不同,但本质思想都是相同的。

2)select怎么用?

select基本语法

select命令的基本语法如下:

select的结构跟switch有些相似,不过仅仅只是形式上相似而已,本质上大为不同。select中的多个case的表达式必须都是Channel的读写操作,不能是其他的数据类型。select通过多个case监听多个Channel的读写操作,任何一个case可以执行则选择该case执行,否则执行default。如果没有default,且所有的case均不能执行,则当前的goroutine阻塞。

select没有case,永久阻塞

Go执行如下的代码:

会发生程序因为select所在goroutine永久阻塞而失败的现象:

对于空的 select 语句,程序会被阻塞,确切的说是当前协程被阻塞,同时 Go 自带死锁检测机制,当发现当前协程再也没有机会被唤醒时,则会发生 panic。所以上述程序会 panic。

select所有case均无法执行且没有default,则阻塞

Go执行如下代码:

程序会发生因所有case不满足执行条件,且没有default分支,而阻塞,由于 Go 自带死锁检测机制,当发现当前协程再也没有机会被唤醒时,则会发生 panic:

select有一个case和default

如果修改代码如下:

select有一个case分支和default分支,当case分支不满足执行条件时执行default分支:

如果有满足的分支,则执行对应的分支:

程序运行后,输出结果如下:

select多个case同时可以执行,随机选择一个去执行

程序运行后,输出结果如下:

如果多次运行该程序,会发现,第一个case、第二个case和第三个case都会被执行。也就是说,此时所有分支条件都满足,则随机选择一个 case 执行。

select在编译期和运行时的执行过程

1)select的实现原理

select在 Go 语言的源代码中不存在对应的结构体,只是定义了一个 runtime.scase 结构体(在src/runtime/select.go)表示每个 case 语句(包含defaut):

因为所有的非 default 的 case 基本都要求是对Channel的读写操作,所以 runtime.scase 结构体中也包含一个 runtime.hchan 类型的字段存储 case 中使用的 Channel,另一个字段 elem 指向 case 条件包含的数据的指针,如 case ch1

select语句在编译期间会被转换成 ir.OSELECT 类型的节点,见 src/cmd/compile/internal/walk/stmt.go 的 walkStmt() 函数:

处理OSELECT类型节点的函数是src/cmd/compile/internal/walk/select.go 的 walkSelect() 函数:

编译器在中间代码生成期间会根据 select 中 case 的不同对控制语句进行优化,这一过程都发生在 src/cmd/compile/internal/walk/select.go 的 walkSelectCases() 函数中。

下面主要是分多种情况分析walkSelectCases() 函数对不同case分支条件的处理,不同的情况会调用不同的运行时函数。如图2.1所示,是编译器对不同的case情况的处理,在运行时会调用不同的函数

图2.1   编译器对不同的case情况在运行时调用不同的函数

2)当select没有case

从1.2.2小节的事例,我们可以知道,当select没有case时,select所在的goroutine会永久阻塞,程序会直接panic。

从 walkSelectCases() 函数对无case的处理逻辑,可以看到,该种情况会直接调用 runtime.block() 函数:

runtime.block() 函数会调用 gopark() 函数以waitReasonSelectNoCases的原因挂起当前协程,并且永远无法被唤醒,Go程序检测到这种情况,直接panic:

3)当select只有一个非default的case

select只有一个非 default 的 case 时,只有一个channel,实际会被编译器转换为对该channel的读写操作,和实际调用 data :=

该段代码的select语句,会被编译器转换为:

读取ch成功后,才能执行该分支的语句,否则程序一直会阻塞。具体的实现原理在 walkSelectCases() 函数中:

从注释中可以看出,在select只有一个case并且这个case不是default时,select对case的处理就是对普通channel的读写操作。

4)当select有一个channel的case + 一个default的case

在很多讲Channel的文章中,打印下面代码的汇编,会看到select只有一个操作channel的case和一个default时,会调用编译器的runtime.selectnbrecv() 函数和runtime.selectnbsend()函数。

编译器会将其改写为:

检查 walkSelectCases() 函数:

runtime.selectnbrecv() 函数和runtime.selectnbsend()函数会分别调用runtime.cahnrecv()函数和runtime.chansend()函数,我们可以看到传入这两个函数的第三个参数都是false,该参数是 block,为false代表非阻塞,即每次尝试从channel读写值,如果不成功则直接返回,不会阻塞。

5)当select有多个channel的case

如果对如下代码打印汇编,会发现执行select动作实际是调用的runtime.selectgo()函数:

继续分析walkSelectCases()函数,处理多case的代码逻辑如下:

从对多case的编译器处理逻辑,可以看到分为三个阶段:

第一阶段,生成scase对象数组,定义selv和order数组,selv存放scase数组内存地址,order用来做scase排序使用,对scase数组排序是为了以某种机制选出待执行的case;

第二阶段,编译器生成调用 runtime.selectgo() 的逻辑,selv和order数组作为入参传入selectgo() 函数,同时定义该函数的返回值,chosen 和 recvOK,chosen 表示被选中的case的索引,recvOK表示对于接收操作,是否成功接收;

第三阶段,根据 selectgo 返回值 chosen 来生成 if 语句来执行相应索引的 case。

6)select在多case下调用的运行时selectgo函数怎样实现多channel的选择?

下面开始分析runtime.selectgo()函数的主要逻辑,逻辑流程图如图所示。

selectgo函数处理主逻辑

selectgo函数首先会执行必要的初始化操作,并生成处理case的两种顺序:轮询顺序polIorder和加锁顺序lockorder。

轮询顺序 pollorder 是通过runtime.fastrandn 函数引入随机性;随机的轮询顺序可以避免 channel 的饥饿问题,保证公平性。加锁顺序 lockorder是按照 channel 的地址排序后确定的加锁顺序,这样能够避免死锁的发生。

加锁和解锁调用的是runtime.sellock()函数和runtime.selunlock()函数。从下面的代码逻辑中可以看到,两个函数分别是按lockorder顺序对channel加锁,以及按lockorder逆序释放锁。

接下来,是selectgo()函数的主处理逻辑,它会分三个阶段查找或等待某个channel准备就绪:首先,根据 pollorder 的顺序查找 scases 是否有可以立即收发的 channel;其次,将当前 goroutine 加入各 case 的 channel 对应的收发队列上并等待其他 goroutine 的唤醒;最后,当前 goroutine 被唤醒之后找到满足条件的 channel 并进行处理;

需要说明的是,runtime.selectgo 函数会根据不同情况通过 goto 语句跳转到函数内部的不同标签执行相应的逻辑。其中包括:bufrecv:可以从channel缓冲区读取数据;bufsend:可以向channel缓冲区写入数据;recv:可以从休眠的发送方获取数据;send:可以向休眠的接收方发送数据;rclose:可以从关闭的 channel 读取 EOF;sclose:向关闭的 channel 发送数据;retc:结束调用并返回;

先看主处理逻辑的第一个阶段,根据 pollorder 的顺序查找 scases 是否有可以立即收发的 channel:

主要处理逻辑是:

当 case 会从 channel 中接收数据时,如果当前 channel 的 sendq 上有等待的 goroutine,就会跳到 recv 标签并从缓冲区读取数据后将等待 goroutine 中的数据放入到缓冲区中相同的位置;如果当前 channel 的缓冲区不为空,就会跳到 bufrecv 标签处从缓冲区获取数据;如果当前 channel 已经被关闭,就会跳到 rclose 做一些清除的收尾工作。

当 case 会向 channel 发送数据时,如果当前 channel 已经被关闭,就会直接跳到 sclose 标签,触发 panic 尝试中止程序;如果当前 channel 的 recvq 上有等待的 goroutine,就会跳到 send 标签向 channel 发送数据;如果当前 channel 的缓冲区存在空闲位置,就会将待发送的数据存入缓冲区。

当 select 语句中包含 default 即 block为 false 时;表示前面的所有 case 都没有被执行,这里会解锁所有 channel 并返回,意味着当前 select 结构中的收发都是非阻塞的。

如果没有可以立即处理的 channel,则进入主逻辑的下一个阶段,根据需要将当前 goroutine 加入 channel 对应的收发队列上并等待其他 goroutine 的唤醒。

等到 select 中的一些 channel 准备就绪之后,当前 goroutine 就会被调度器唤醒。这时会继续执行 runtime.selectgo 函数的第三部分:

这里主要是:首先,先释放当前goroutine的等待队列,因为已经被某个case的sudog唤醒了;其次,遍历全部的case的sudog,找到唤醒当前goroutine的case的索引并返回,后面会根据它做channel的收发操作;最后,剩下的不是唤醒当前goroutine的case,需要将当前goroutine从这些case的发送队列或接收队列出队,并释放这些case的sudog;

selectgo() 函数的最后一些代码,是循环第一阶段用到的跳转标签代码段;

bufsend 和 bufrecv 两个代码段,这两段代码的执行过程都很简单,它们是向 channel 的缓冲区中发送数据或者从缓冲区中获取数据;

两个直接收发 channel 的情况recv、send,会调用运行时函数 runtime.send 和 runtime.recv,这两个函数会与处于休眠状态的 goroutine 打交道;

向关闭的 channel 发送数据或者从关闭的 channel 中接收数据分别是 sclose 和 rclose阶段;sclose,向一个关闭的 channel 发送数据就会直接 panic 造成程序崩溃;rclose,从一个关闭 channel 中接收数据会直接清除 Channel 中的相关内容;retc阶段,退出程序。

总结

综合上面的分析,总结如下:

编译器会对select有不同的case的情况进行优化以提高性能。首先,编译器对select没有case、有单case和单case+default的情况进行单独处理,这些处理或者直接调用运行时函数,或者直接转成对channel的操作,或者以非阻塞的方式访问channel,多种灵活的处理方式能够提高性能,尤其是避免对channel的加锁。

对最常出现的select有多case的情况,会调用runtime.selectgo()函数来获取执行case的索引,并生成 if 语句执行该case的代码。

selectgo函数的执行分为四个步骤:首先,随机生成一个遍历case的轮询顺序 pollorder 并根据 channel 地址生成加锁顺序 lockorder,随机顺序能够避免channel饥饿,保证公平性,加锁顺序能够避免死锁和重复加锁;然后,根据 pollorder 的顺序查找 scases 是否有可以立即收发的channel,如果有则获取case索引进行处理;再次,如果pollorder顺序上没有可以直接处理的case,则将当前 goroutine 加入各 case 的 channel 对应的收发队列上并等待其他 goroutine 的唤醒;最后,当调度器唤醒当前 goroutine 时,会再次按照 lockorder 遍历所有的case,从中查找需要被处理的case索引进行读写处理,同时从所有case的发送接收队列中移除掉当前goroutine。

工作日晚8点 看腾讯技术、学专家经验

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230104A07YDW00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券