服务发现的深入研究，不谈理念谈干货

魏新宇

发布于 2018-03-22 16:21:18

8750

发布于 2018-03-22 16:21:18

文章被收录于专栏：大魏分享（微信公众号：david-share）

服务发现是怎么“火”起来的

我们知道，在写代码的时候，为了完成服务请求的时候，代码需要知道服务实例的IP地址和端口。所以说，服务发现，发现的是服务实例的IP地址和端口。

那么，为什么服务发现这两年比较火呢？

在小型机和X86虚拟化时代，应用运行在VM或者小型机上，其应用的IP地址和端口相对固定，很少变化。为为了预防可能发生的变化，代码可以从应用的配置文件中读取IP地址和端口。

例如，HAproxy的配置文件，将HAproxy的后端设置为Mysql集群

那么，问题来了，在虚拟机、物理机和小型机里，应用的IP相对是固定的。即使应用被重启甚至破坏，应用重建配置的时候，读取的还是配置文件中的内容，IP是不发生变化的。

但是，在以容器为基础的微服务时代，应用运行的载体是容器。一个pod有业务IP和Service IP。Server IP负责不同Service之间的Pod通讯、东西向流量。Pod自身的IP负责南北向流量（在Openshift中），Routing Layer将应用的FQDN映射到Pod的IP。

而如果一个pod被破坏，发生pod重建，其IP会发生变更。

两个pod的初始IP：

删除pod，自动重建：

pod重建后的IP：

我们发现，IP已经发生了变化。

因此，在以容器为载体的微服务时代，用写配置文件的方法获取IP和端口，显然不太现实。

因此，需要引入服务发现的机制：

服务发现的方式

服务发现的两种实现方式分别是：客户端发现和服务器端发现。

1.客户端发现

当使用客户端发现模式时，客户端负责决定相应服务实例的网络位置，并且对请求实现负载均衡。客户端从一个服务注册服务中查询，其中是所有可用服务实例的库。客户端使用负载均衡算法从多个服务实例中选择出一个，然后发出请求。

服务实例的网络位置是在启动时注册到服务注册表中，并且在服务终止时从注册表中删除。服务实例注册信息一般是使用心跳机制来定期刷新的。

如下图，Service Instance A在启动的时候，将自己的IP和端口自动注册到Service Registry（服务注册表）中。当Service Instance A想要访问其他Service实例的时候（如Service Instance B），首先将会去Service Registry其查询，在获取到IP地址和端口号以后，就可以进行访问了。

非常著名的一种客户端服务端服务发现模式是Netflix OSS。其中，Netflix Eureka是服务注册表，为服务实例注册管理和查询可用实例提供了RESTAPI接口。Netflix Ribbon是一种IPC客户端，与Eureka合同工作实现对请求的负载均衡。

客户端发现的好处比较明显，简单直接。缺点是需要针对不同的编程语言注册不同的服务，在客户端需要为每种语言开发不同的服务发现逻辑(在微服务框架中，这是不现实的。因为每个微服务的编程语言都可能不同)。 2.服务端发现模式

客户端通过负载均衡器向某个服务提出请求，负载均衡器向服务注册表发出请求，将每个请求转发往可用的服务实例。跟客户端发现一样，服务实例在服务注册表中注册或者注销。

最大的优点是客户端无需关注发现的细节，客户端只需要简单的向负载均衡器发送请求，实际上减少了编程语言框架需要完成的发现逻辑()。这种模式也有缺陷，除非部署环境提供负载均衡器，否则负载均衡器是另外一个需要配置管理的高可用系统功能（etcd本身自带负载均衡功能）。

服务注册表

服务注册表是服务发现很重要的部分，它是包含服务实例网络地址的数据库。服务注册表需要高可用而且随时更新。客户端可以缓存从服务注册表获得的网络地址。

上文已经提到，Netflix OSS是用Eureka做服务注册表，除此之外，还有几种常用的服务注册表：

etcd – 是一个高可用，分布式的，一致性的，键值表，用于共享配置和服务发现。

consul– 是一个用于发现和配置的服务。提供了一个API允许客户端注册和发现服务。Consul可以用于健康检查来判断服务可用性。

Apache ZooKeeper – 是一个广泛使用，为分布式应用提供高性能整合的服务。

上表中：

关于一致性：Paxos和Raft都是为了实现Consensus一致性这个目标，这个过程如同选举一样，参选者需要说服大多数选民(服务器)投票给他，一旦选定后就跟随其操作。Paxos和Raft的区别在于选举的具体过程不同。

在之前，Paxos一直是分布式协议的标准，但是Paxos难于理解，更难以实现。而斯坦福大学提出的新的分布式协议研究称为Raft。

关于CAP：CAP原则又称CAP定理，指的是在一个分布式系统中，Consistency（一致性）、 Availability（可用性）、Partition tolerance（分区容错性;分区相当于对通信的时限要求），三者不可得兼得。

所以，整体上看，服务注册表各有各的优势。从实际落地的微服务案例看，笔者接触到较多的是etcd和Consul。

服务注册

介绍了服务发现以后，接下来我们看看服务注册。

服务实例必须向注册表（如etcd、Consul、Eureka）中注册和注销，那么，服务实例究竟如何注册到服务注册表呢？有两种方法：

1.服务实例自己注册，也叫自注册模式（self-registration pattern）

当使用自注册模式时，服务实例负责在服务注册表中注册和注销。也就是说，各个服务实例，自己负责自己的注册。

另外，如果需要的话，一个服务实例也要发送心跳来保证注册信息不会过时。下图描述了这种架构：

自注册模式也有优缺点。一个优点是，相对简单，不需要其他系统功能。而一个主要缺点则是，把服务实例跟服务注册表联系起来。必须在每种编程语言和框架内部实现注册代码。

2.第三方注册模式（third party registration pattern）

当使用第三方注册模式时，服务实例并不负责向服务注册表注册，而是由另外一个系统模块，叫做服务管理器，负责注册。服务管理器通过查询部署环境或订阅事件来跟踪运行服务的改变。当管理器发现一个新可用服务，会向注册表注册此服务。服务管理器也负责注销终止的服务实例。下图是这种模式的架构图。

第三方注册模式优点是服务跟服务注册表是分离的，不需要为每种编程语言和架构完成服务注册逻辑，服务实例是通过一个集中化管理的服务进行管理的（etcd和Consul都是服务管理器）。缺点是，需要保证服务管理器的高可用（OCP中可以配置etcd集群，也可以创建容器化的etcd，通过rc来保证其高可用，不过这个功能目前属于技术预览）。

Openshift的服务发现和服务注册

Openshift使用的服务发现和服务注册是etcd。也就是说，Openshift的服务发现使用的是etcd，服务发现方面：它是服务端的发现模式、服务注册方面：它是属于第三方注册模式。再简单点说，etcd在OCP中，既当服务注册表，又当服务管理器。

一个 etcd 节点的核心由三部分组成：

Raft：raft 状态机是对 raft 共识算法的实现
WAL：raft 日志存储
Storage：数据的存储与索引

在默认设定下，etcd 通过主机的 2379 端口向 Client 提供服务。如下图：

每个主机上的应用程序都可以通过主机的 2379 以 HTTP + JSON 的方式向 etcd 读写数据。写入的数据会由 etcd 同步到集群的其它节点中。

在默认设定下，etcd 通过主机的 2380 端口在各个etcd节点中同步 raft 状态及数据(笔者实验环境只有一个etcd节点，因此不需要多个etcd节点之间的通讯和数据同步)。

etcd的功能，就是下图Master上，做Data store的角色。

在Openshift最新的版本V3.6中，使用的是etcd3 v3 data model。

引入etcd3 v3，对openshift带来的好处有：

Larger memory space to enable larger cluster sizes（更大内存空间使OCP集群可以更大）.
Increased stability in adding and removing nodes in general life cycle actions.（在为OCP增加或者删除节点的时候，整个OCP集群稳定性更好）
A significant performance boost（性能更强）.

在Openshift中，etcd可以安装在Master节点上，也可以安装在单独的服务器上。

在笔者OCP3.6的实验环境中，etcd是作为程序安装在master节点上的。etcd的版本是3.1.7：

查看etcd的进程：

我们可以看到：

--listen-client-urls=https://192.168.137.10:2379，

其中，192.168.137.10是master节点的IP。也就是说etcd server通过绑定到master节点的2379端口。

etcd支持http RESTful API，支持get查询，post，delete，put等操作。为了便于理解，可将它存储数据的框架看做一个文件系统，可以创建目录和“文件”，每个“文件”名就是一个key，每个“文件”的内容就是它的value，目录没有value只能包含子目录或者“文件”，可以通过RESTful API来获取这些key的值或者设置这些key的值。

查看etcd集群的成员：