《架构师之路:架构设计中的100个知识点》
87.接入层架构演进
接入层架构?
不就是反向代理层(Nginx、LVS、F5等)吗?
不是很成熟吗?
有什么好讲的?
知其然,知其所以然。
【1】开篇
反向代理层有什么用?
1. 作为服务端统一入口,屏蔽后端WEB集群细节,代表整个WEB集群;
画外音:这就是为啥它叫反向代理。
2. 保证WEB集群的扩展性,Nginx后端可随时加WEB实例;
3. 实施负载均衡,反向代理层会将请求均匀分发给后端WEB集群的每一个实例;
4. 保证WEB集群的高可用,任何一个WEB实例挂了,服务都不受影响;
反向代理层还存在啥问题?
反向代理层自身的扩展性问题并没有得到很好的解决,例如当Nginx成为系统瓶颈的时候,无法扩容。
DNS轮询如何解决反向代理层的扩展性问题?
通过在DNS-server上对一个域名设置多个IP解析,能够增加入口Nginx实例个数,起到水平扩容的作用,解决反向代理层的扩展性问题。
因此,反向代理和DNS轮询并不是互斥的技术,而是互补的技术。
接入层架构演进,听我娓娓道来。
【2】裸奔方案:单机接入架构
裸奔时代的架构图如上:
1. 浏览器通过DNS-server,域名解析到ip;
2. 浏览器通过ip访问web-server;
缺点:
1. 非高可用,web-server挂了整个系统就挂了;
2. 扩展性差,当吞吐量达到web-server上限时,无法扩容;
画外音:单机不涉及负载均衡问题。
【3】简易扩容方案:DNS轮询
假设tomcat的吞吐量是1000次每秒,当系统总吞吐量达到3000时,如何扩容是首先要解决的问题,DNS轮询是一个很容易想到的方案。
画外音:DNS轮询解决扩展性问题。
此时的架构图如上:
1. 多部署几份web-server,1个tomcat抗1000,部署3个tomcat就能抗3000;
2. 在DNS-server层面,域名每次解析到不同的ip;
优点:
1. 零成本:在DNS-server上多配几个ip即可,功能也不收费;
2. 部署简单:多部署几个web-server即可,原系统架构不需要做任何改造;
3. 负载均衡:变成了多机,负载也是均衡的;
缺点:
1. 非高可用:DNS-server只负责域名解析ip,这个ip对应的服务是否可用,DNS-server是不保证的,假设有一个web-server挂了,部分服务会受到影响;
2. 扩容非实时:DNS解析有一个生效周期;
3. 暴露了太多的外网ip;
【4】统一接入方案:反向代理
tomcat的性能较差,但Nginx作为反向代理的性能就强很多,假设线上跑到1w,就比tomcat高了10倍,可以利用这个特性来做扩容。
此时的架构图如上:
1. 站点层与浏览器层之间加入了一个反向代理层,利用高性能的Nginx来做反向代理;
2. Nginx将http请求分发给后端多个web-server;
优点:
1. DNS-server不需要动;
2. 负载均衡:通过Nginx来保证;
3. 只暴露一个外网ip,Nginx->tomcat之间使用内网访问;
4. 扩容实时:Nginx内部可控,随时增加web-server随时实时扩容;
5. 能够保证站点层的可用性:任何一台tomcat挂了,Nginx可以将流量迁移到其他tomcat;
画外音:反向代理,能够更实时,更方便的扩容了。
缺点:
1. 时延增加+架构更复杂了:中间多加了一个反向代理层;
2. 反向代理层成了单点,非高可用:tomcat挂了不影响服务,Nginx挂了怎么办?
【5】高可用反向代理方案:keepalived
为了解决高可用的问题,keepalived出场了。
1. 做两台Nginx组成一个集群,分别部署上keepalived,设置成相同的虚IP,保证Nginx的高可用;
2. 当一台Nginx挂了,keepalived能够探测到,并将流量自动迁移到另一台Nginx上,整个过程对调用方透明;
优点:
1. 解决了高可用的问题;
画外音:反向代理的高可用也解决了。
缺点:
1. 资源利用率只有50%;
2. Nginx仍然是接入单点,如果接入吞吐量超过Nginx的性能上限怎么办,例如qps达到了50000咧?
【6】多级反向代理方案:lvs/f5
Nginx是应用软件,性能比tomcat好,但总有个上限,超出了上限,还是扛不住。
lvs就不一样了,它实施在操作系统层面;f5的性能又更好了,它实施在硬件层面;它们性能比Nginx好很多,例如每秒可以抗10w,这样可以利用他们来扩容,常见的架构图如下:
1. 如果通过Nginx可以扩展多个tomcat一样,可以通过lvs来扩展多个Nginx;
2. 通过keepalived+VIP的方案可以保证可用性;
99.99%的公司到这一步基本就结束了,解决了接入层高可用、扩展性、负载均衡的问题。
完美了嘛,还有什么潜在问题?
好吧,不管是使用lvs还是f5,这些都是scale up的方案,根本上,lvs/f5还是会有性能上限,假设每秒能处理10w的请求,一天也只能处理80亿的请求(10w秒吞吐量*8w秒),那万一系统的日PV超过80亿怎么办呢?
【7】scale out扩容方案:DNS轮询
如之前文章所述,水平扩展,才是解决性能问题的根本方案,能够通过加机器扩充性能的方案才具备最好的扩展性。
facebook,google,baidu的PV是不是超过80亿呢,它们的域名只对应一个ip么,终点又是起点,还是得通过DNS轮询来进行扩容。
画外音:DNS轮询解决扩展性问题。
1. 通过DNS轮询来线性扩展入口lvs层的性能;
2. 通过keepalived来保证高可用;
3. 通过lvs来扩展多个Nginx;
4. 通过Nginx来做负载均衡,业务七层路由;
简单总结
接入层架构演进,有一个循序渐进的过程,其核心设计点如下:
1. 需要考虑:高可用、扩展性、反向代理、负载均衡;
2. Nginx、keepalived、lvs、f5可以很好的解决高可用、扩展性、反向代理、负载均衡的问题;
3. 水平扩展scale out是解决扩展性问题的根本方案,DNS轮询不能完全被Nginx/lvs/f5所替代;
知其然,知其所以然。
思路比结论更重要。
==全文完==