《企业IT架构转型之道》读书笔记（部分2）

SammyLiu

发布于 2019-06-28 16:52:13

6030

发布于 2019-06-28 16:52:13

文章被收录于专栏：世民谈云计算

2007年，淘宝已经拥有超过500人的技术团队规模，整个淘宝网站是一个几百兆字节的WAR包，大小功能模块超过200个。

这带来了以下几个问题：

解决以上问题的根本在于业务的拆分。结果，在应用部署形态上，由之前一个几百兆字节大小的WAR包部署模式改造成为上百个WAR包独立部署的服务化架构。

好处：

技术选型：SOA ESB 架构还是分布式架构？

SOA 主要特征：

传统SOA ESB的服务调用方式的问题：

阿里巴巴分布式服务框架 HSF：

主要组件：

服务提供者。为了保障服务高可用，一般都是集群部署。每个HSF应用均是以War包的形式存在，运行在Tomcat容器中。在Tomcat 容器层，已经集成了HSF服务框架对服务提供者或服务调用者进行配置服务器发现、服务注册、订阅、失败转移等功能。目前，淘宝内部大部分应用的部署方式，还是一个虚拟机运行一个tomcat容器，每个tomcat运行一个服务应用。
服务调用者。这是服务的消费者，大多数也是以WAR应用包的方式运行在 tomcat 容器中。
地址服务器。由 Nginix 实现。
配置服务器。负责记录所有服务发布和服务订阅信息，并将服务相关信息推送到服务节点上。
Diamond 服务器。本质上也是一个通用的统一配置管理服务。

关于『服务中心』的概念：

服务中心一定是不断发展的。业务架构是能反应业务变化的，服务中心作为共享架构的核心元素一定也会提现出这种变化。
服务中心的服务形态的多样性。有人理解的服务中心是狭义的接口服务，这比较片面化，虽然接口是服务最重要的形式。服务中心提供的服务能力，可以分为三类：
- 依赖于接口的服务
- 依赖于工具的服务
- 依赖于数据的服务

服务中心设计的一些原则：

需求：

服务中心需要能很好地支撑将来任何业务场景的访问性能的要求，而数据库是最容易产生性能瓶颈的服务组件。

几个步骤：

淘宝的做法是基于数据库分库分表的方式，利用分布式数据库平台解决数据库瓶颈问题。

第一步：数据库的读写分离。拓展了数据库读读的处理能力，整体上也提高了数据库的读写能力，但这样的架构在主数据库上的写能力依然没法扩展。

第二步：当出现单个表的数据量很大的情况，则需要采用水平分区的方式对数据进行拆分，即将同一个表中的不同数据拆分到不同的数据库中。比如，对用户数据按照用户 ID 进行 has 取模的方式实现用户数据平均分到 8个数据库中，确保了单个数据库中保存的数据量在单机数据库能提供良好读写性能的范围内。

第三步：在2008年，阿里巴巴内部开始了分布式数据库的研发。

一些最佳实践：

开发了分布式数据层框架TDDL。针对分库分表场景，提供了对各种业务场景的支持更加完善，开发人员体验更加友好，管控能力大幅提升。
数据尽可能平均拆分。在分库分表场景下，最重要的一个原则就是被拆分的数据尽可能的平均拆分到后端的数据库中。如果拆分不平均，还会产生数据访问热点，这就同样存在热点数据因为增长过快而面临数据单表数据过大的问题。
尽量减少事务边界。
异构索引表尽量降低全表扫描概率。一个解决思路是『拿空间换时间』。
将多条件频繁查询引入搜索引擎平台。
简单就是美。