Go 语言之三驾马车

导语:Go语言的三个核心设计: interface 、goroutine 、 channel

less is more —— Wikipedia

interface

Go是一门面向接口编程的语言,interface的设计自然是重中之重。Go中对于interface设计的巧妙之处就在于空的interface可以被当作“Duck”类型使用,它使得Go这样的静态语言拥有了一定的动态性,却又不损失静态语言在类型安全方面拥有的编译时检查的优势。

source code

从底层实现来看,interface实际上是一个结构体,包含两个成员。其中一个成员指针指向了包含类型信息的区域,可以理解为虚表指针,而另一个则指向具体数据,也就是该interface实际引用的数据。

其中 interfacetype 包含了一些关于interface本身的信息,_type表示具体实现类型,在下文eface中会有详细描述,bad 是一个状态变量,fun是一个长度为1的指针数组,在 fun0 的地址后面依次保存method对应的函数指针。go runtime 包里面有一个hash表,通过这个hash表可以取得 itab,link跟inhash则是为了保存hash表中对应的位置并设置标识。主要代码如下:

Itab的结构如下:

其中 interfacetype 包含了一些关于interface本身的信息,_type表示具体实现类型,在下文eface中会有详细描述,bad 是一个状态变量,fun是一个长度为1的指针数组,在 fun0 的地址后面依次保存method对应的函数指针。go runtime 包里面有一个hash表,通过这个hash表可以取得 itab,link跟inhash则是为了保存hash表中对应的位置并设置标识。主要代码如下:

空接口的实现略有不同。Go中任何对象都可以表示为interface{},类似于C中的 void*,而且interface{}中存有类型信息。

Type的结构如下:

i_example

关于interface的应用,下面举个简单的例子,是关于Go与Mysql数据库交互的。

首先在mysql test库中创建一张任务信息表:

数据库交互最基本的四个操作:增删改查, 这里以查询为例:

Go来实现查询这张表里面的所有数据

其中:

这段代码可以实现查表这个简单的逻辑,但是有一个小小的问题就是,我们这张表结构比较简单只有4个字段,如果换一张有20+个字段甚至更多的表来查询的话,这段代码就显得太过于低效,这个时候我们便可以引入interface{}来进行优化。

优化后的代码如下:

由于interface{}可以保存任何类型的数据,所以通过构造args、values两个数组,其中args的每个值指向values相应值的地址,来对数据进行批量的读取及后续操作,值得注意的是Go是一门强类型的语言,而且不同的interface{}是存有不同的类型信息的,在进行赋值等相关操作时需要进行类型转换。

Go对于Mysql事务处理也提供了比较好的支持。一般的操作使用的是db对象的方法,事务则是使用sql.Tx对象。使用db的Begin方法可以创建tx对象。tx对象也有数据库交互的Query,Exec和Prepare方法,与db的操作类似。查询或修改的操作完毕之后,需要调用tx对象的Commit()提交或者Rollback()回滚。

例如,现在需要利用事务对之前创建的user表进行update操作,代码如下

注意: “ := “ 跟 “ = “两个操作符不要弄混淆

如果不需要进行事务处理的话,update对应的代码如下:

可以与上面增加事务操作的代码进行对比,因为操作比较简单所以也就增加了几行代码,以及将db对象换成了tx对象。

goroutine

并发:同一时间内处理(dealing with)不同的事情

并行:同一时间内做(doing)不同的事情

Go从语言层面就支持了并行,而goroutine则是Go并行设计的核心。本质上,goroutine就是协程,拥有独立的可以自行管理的调用栈,可以把goroutine理解为轻量级的thread。但是thread是操作系统调度的,抢占式的。goroutine是通过自己的调度器来调度的。

scheduler

Go的调度器实现了G-P-M调度模型,其中有三个重要的结构:M,P,G

M : Machine (OS thread)

P : Context (Go Scheduler)

G : Goroutine

底层的数据结构长这样:

M、P 和 G 之间的交互可以通过下面这几张来自go runtime scheduler的图来展现

上图中看,有2个物理线程M,每一个M都拥有一个上下文P,也都有一个正在运行的goroutine G。图中灰色的那些G并没有运行,而是出于ready的就绪态,正在等待被调度。由P来维护着这个runqueue队列。

图中的M1可能是被新建出来的,也可能是从线程缓存中取出来的。当M0返回时,它必须尝试获取P来运行G,通常情况下,它会尝试从其他的thread那里”steal”一个P过来,失败的话,它就把G放在一个global runqueue里,然后自己会被放入线程缓存里。所有的P会周期性的检查global runqueue,否则global runqueue上的G永远无法执行。

另一种情况是P所分配的任务G很快就执行完了(因为分配不均),这就导致了某些P处于空闲状态而系统却依然在运行态。但如果global runqueue没有任务G了,那么P就不得不从其他的P那里拿一些G来执行。通常情况下,如果P从其他的P那里要偷一个任务的话,一般就‘steal’ runqueue的一半,这就确保了每个thread都能充分的使用。

P如何从其他P维护的队列中”steal”到G呢?这就涉及到work-stealing算法,关于该算法的更多信息可以参考这篇文章。

g_example

举个简单的例子来演示下goroutine是如何运行的

这段代码非常简单,两个不同的goroutine异步运行

运行结果如下:

然后做个小小的改动,只是将main()中的两个函数的位置互换,其余代码变:

会出现一件有意思的事情:

原因也很简单,因为main()返回时, 并不会等待其他goroutine(非主goroutine)结束。对上面的例子, 主函数执行完第一个say()后,创建了一个新的goroutine没来得及执行程序就结束了,所以会出现上面的运行结果。

channel

goroutine在相同的地址空间中运行,因此必须同步对共享内存的访问。Go语言提供了一个很好的通信机制channel,来满足goroutine之间数据的通信。channel与Unix shell 中的双向管道有些类似:可以通过它发送或者接收值。

source code

其中waitq的结构如下

可以看到channel其实就是一个队列加一个锁。其中sendx和recvx可以看做生产者跟消费者队列,分别保存的是等待在channel上进行读操作的goroutine和等待在channel上进行写操作的goroutine,如下图所示。

写channel (ch <- x)的具体实现如下(只选取了核心代码):

具体可以分为三种情况:

  • 有goroutine阻塞在channel上,而且chanbuf为空,直接将数据发送给该goroutine上。
  • chanbuf有空间可用:将数据放到chanbuf里面。
  • chanbuf没有空间可用:阻塞当前goroutine。

读channel( <-ch)和发送的操作类似,就不帖代码展示了。

c_example

关于goroutine跟channel进行通信的一个简单的例子,逻辑很简单:

这里我们定义了两个带缓存的channel jobs 和 results,如果把这两个channel都换成不带缓存的,就会报错,不过可以这样进行处理就可以了:

比较常见的channel操作还有select , 存在多个channel的时候,可以通过select可以监听channel上的数据流动。

因为 ch1 和 ch2 都为空,所以 case1 和 case2 都不会读取成功。 则 select 执行 default 语句。

原创声明,本文系作者授权云+社区-专栏发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

唐郑望的专栏

1 篇文章1 人订阅

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏未闻Code

使用生成器把Kafka写入速度提高1000倍

通过本文你会知道Python里面什么时候用yield最合适。本文不会给你讲生成器是什么,所以你需要先了解Python的yield,再来看本文。

631
来自专栏GreenLeaves

一、Linq简介

1193
来自专栏向治洪

Java的依赖注入(控制反转)

两个主角“依赖注入”和“控制反转”: 1、二都说的都是同一件事,只是叫法不同。是一个重要的面向对象编程的法则,也是一种设计模式; 2、英文原称:依赖注入,...

19010
来自专栏企鹅号快讯

Python的线程

本文是基于Py2.X 线程 多任务可以由多进程完成,也可以由一个进程内的多线程完成。 我们前面提到了进程是由若干线程组成的,一个进程至少有一个线程。 多线程类似...

1818
来自专栏Astropeak

Python:怎样用线程将任务并行化?

1317
来自专栏java一日一条

Java接口回调机制详解

最近在看android fragment与Activity进行数据传递的部分,看到了接口回调的内容,今天来总结一下。

653
来自专栏高性能服务器开发

libevent源码深度剖析(六) 初见事件处理框架

(1)libevent源码深度剖析一 序 (2)libevent源码深度剖析二 Reactor模式 (3)libevent源码深度剖析三 libevent基...

1082
来自专栏架构之路

socket在windows和Linux下的区别

1)头文件  windows下winsock.h/winsock2.h  linux下sys/socket.h    错误处理:errno.h  2)初始化 ...

2994
来自专栏达观数据

达观数据对AngularJS技术的思考与实践

AngularJs诞生于2009年,最初由MiskoHevery和Adam Abrons开发,后来成为Google的项目。AngularJS 是一个为动态WEB...

35115
来自专栏余林丰

8.并发容器ConcurrentHashMap#put方法解析

jdk1.7.0_79   HashMap可以说是每个Java程序员用的最多的数据结构之一了,无处不见它的身影。关于HashMap,通常也能说出它不是线程安全的...

2776

扫码关注云+社区