本文主要是笔者对《大型网站技术架构》一书的总结归纳。主要通过两种方式展现,一是通过「思维导图」的形式输出;另一种,就是本文以图文的形式更加详细和展开的描述‘大型网站技术架构’的方方面面。
image
根据大型网站的特点,该架构能够解决大多数的技术问题。下面我们将这个架构图进行简单的分解。
分层是企业应用系统中最常见的一种架构模式,将系统在横向维度(功能架构维度)上切分成几个部分,每个部分负责一部分相对比较单一的职责,然后通过上层对下层的依赖和调用组成一个完整的系统。
在大型网站架构中采用的分层结构,会将网站软件系统分为“应用层”、“服务层”、“数据层”。
应用层 | 负责具体业务和视图展示,如网站首页及搜索输入和结果展示 |
---|---|
服务层 | 为应用层提供服务支持,如用户管理服务,购物车服务等 |
数据层 | 提供数据存储访问服务,如数据库、缓存、文件、搜索引擎等 |
image
虽然分成架构模式最初的目的是规划软件清晰的逻辑结构便于开发维护。但在网站的发展过程中,分层结构对网站支持高并发向分布式方向发展至关重要。因此在网站规模还很小的时候就应该采用分层的架构,这样将来网站做大时才能更好地应对。
如果说分层是将软件在横向方面进行切分,那么分割就是在纵向(业务逻辑维度)方面对软件进行切分。
网站越大,功能越复杂,服务和数据处理的种类也越多,将这些不同的功能和服务分割开来,包装成高内聚低耦合的模块单元。这些模块不管在逻辑上还是物理部署上,都可以是独立的。同样在服务层也可以根据需求将服务分割成合适的模块。
分布式意味着可以使用更多的计算机完成同样的功能,计算机越多,CPU、内存、存储资源也就越多,能够处理的并发访问和数据量就越大,进而能够为更多的用户提供服务。
集群化:即多台服务器部署相同应用构成一个集群,通过负载均衡设备共同对外提供服务。
目的:提高系统的可用性。
使用集群带来的好处: ① 可以提供更好的并发特性; ② 因为一个应用由多台服务器提供,当某台服务器发生故障时,负载均衡设备或者系统的失效转移机制会将请求转发到集群中其他服务器上,使服务器故障不影响用户使用。
缓存就是将数据存放在距离计算最近的位置以加快处理速度。
网站应用中,缓存除了可以加快数据访问速度,还可以减轻后端应用和数据存储的负载压力,这一点对网站数据库架构至关重要,网站数据库几乎都是按照有缓存的前提进行负载能力设计的。
大型网站架构中,系统解耦的手段除了前面提到的分层、分割、分布等,还有一个重要手段是异步,业务之间的消息传递不是同步调用,而是将一个业务操作分成多个阶段,每个阶段之间通过共享数据的方式异步执行进行协作。
该方法会导致响应“延迟”。可以使用优先级队列来保证对时效性高的业务在访问高峰期的及时响应。