专栏首页编程坑太多『互联网架构』软件架构-电商系统架构发展历程(68)

『互联网架构』软件架构-电商系统架构发展历程(68)

以之前看的一本书淘宝这十年来,一起回顾下电商系统的发展历程,其实也折射了目前很多系统的技术的发展变革。源码中有本书,【淘宝技术这十年】,从单机版到目前淘宝的技术状态。

(一)目的
  1. 一起了解学习的分布式专题技术可以串起来。 2.了解电商系统相关的技术知识。 3.面试,工作可以应用到。
(二)一个电商系统到底包含什么

图有点长,网上找的但是如果要做这个系统老费劲了。体力活。美国,苏宁,京东电商大型网站都是上万人研发。可见系统的庞大。

(三)系统的历史
  • 淘宝第一版--个人网站

LAPM 【linux+apche+php+mysql】

  • 1.java早期的电商网站

多个模块在一个系统中,通过jdbc的访问同一个数据库。

存在的问题,随着流量越来越大,数据库查询速度慢,系统反应慢等等,单机的性能瓶颈。

  • 2.java电商网站,引入集群

加机器的方式解决,集群的方式来解决。

存在的问题,访问的那台机器是不知道的。

  • 3.java电商网站,引入负载

增加负载的方式,分为硬负载f5,软负载nginx。

存在的问题,第一次访问的机器是A机器,第二次因为负载了访问了B机器。

  • 4.java电商网站,负载后,请求的4种解决方案。

(1)hash的方式,通过请求IP的hash值绑定要请求的服务器。

存在的问题,abc每次请求都发A机器,这个就是受单点的问题,如果A机器挂了,abc的请求得不到转向,一直请求A机器,用户一直访问不了,一直报错。 (2)session的复制,通过A和B机器进行相互的session复制

存在的问题,tomcat广播的形式,造成资源的浪费,100万用户在线,等于每个tomcat里面都有100万的用户session的信息,对系统的浪费承诺很大。适用于小型网站。 (3)基于cookie的方式,cookie包含session的数据 解决了上面session复制,资源的浪费,服务端的压力的问题。

存在的问题,数据不安全的问题,用户数据的都在客户端,存在破解的可能。手机一般都使用这种cookie的方式,手机都是单独自己使用的,不存在公共部分。 (3)session集中存储的方式,加入redis或者其他中间件

存在的问题,相比前集中增加了redis中间件,增加了运维和开发的成本。如果用户量非常大,用中间件的方式也是可用性非常高的。

  • 5.java电商网站,数据库原来一个应用一个数据库,需要集群数据库用同一个。

5.java电商网站,数据库分读写,解决高并发读写的问题,master和slave流量的问题。

存在的问题:下单之后到主库,然后立马查询到从库。这个时候主库信息还没同步到从库中,系统可能就报错了。这种问题解决方案只有一个TDDL,sharding-jdbc。

  • 6.java电商网站,读写分离,分库分表。

proxy:应用程序在访问数据库的时候,中间拦了一层,通过拦截可以知道是select 还是insert,update判断是走主库还是从库。proxy需要维护,维护高可用,协议要拦截性能要下降。 应用层:shardingJDBC基于jdbc底层的请求原理,请求的时候改成sql的方式。访问读库还是从库。开发人员需要了解shardingJDBC的业务,增加了开发成本和学习的成本。数据库管理需要。

  • 7.java电商系统,增加搜索引擎和redis集群

search cluster 全量同步,和定时增量同步都是通过读mysql的binlog完成的。解决数据库压力。 redis cluster 通过缓存到redis中,直接从redis中获取,减少数据库的读写。 CDN 通过将静态文件放到指定的服务器,通过CDN下载静态资源。

(四)分布式时代

引文:商品模块和会员模块两个不同的人开发,他们是互相调用的关系,商品模块的人开发完毕了,但是会员模块的老铁说,今天不上了,这是不是很尴尬,商品模块的需要回滚到满足会员模块的,两个人就开始掐架了,我好心写了你让我回滚,会员模块的说其实我也不想,这个产品经理不让上。随着系统越来越大,各个模块变成了系统,每个系统是由不同小组来完成的,为了满足互相之前不受影响,就开始服务化。

  • 说说淘宝的HSF 和 dubbo

提供对Dubbo和HSF两个RPC框架的支持。阿里巴巴第一代RPC框架Dubbo是国内第一款成熟的商用级RPC框架,已于2011年正式对外开源,目前已发展成为国内开源价值最高、用户使用规模最大的开源软件之一。最新一代RPC框架HSF,全称High Speed Framework,也叫"好舒服","很舒服"框架,是阿里内部对这一款高性能服务框架的昵称,是一款面向企业级互联网架构量身定制的分布式服务框架。HSF以高性能网络通信框架为基础,提供了诸如服务发布与注册,服务调用,服务路由,服务鉴权,服务限流,服务降级和服务调用链路跟踪等一系列久经考验的功能特性。

他们之前的互相调用很复杂。至少功能进行了解耦,会员和商品之前的依赖关系,会员上线失败只会局部的影响。但是会产生一个问题互相的调用,占用更多的网络资源。

  • 分库分表的方式继续优化

每个应用一个数据库不在整个使用一个数据库了,每个应用一个库,对于比较复杂的利于订单,产品通过sharding-jdbc来进行分表。用的最多的hash取模的方式,hash比较均匀,避免数据热点的问题。但是hash的方式不容易进行扩展,之后会说如何针对hash进行扩展。

  • 消息中间件

异步和解耦,双11下单的量很大,从Notify>metaq>rocketMq都是一样的。削峰填补。下个单需要查库存,告诉统计系统,还有风控系统。平常时候统计系统是不用的,而是双11的时候使用,总不能平常的时候把统计系统的代码注释吧?到双11在把代码放开,然后在上线。利用rocketMq的来解决。

  • 图片服务
  1. oss tfs的方式。上传一次,公用的都可以拿到。给每个图片识别一个号,第二次上传会读hash,如果这个hash已经存在就不在上传。时间换空间的一个问题。解决数据库的一个问题。
  2. 数据库存储图片名称和路径,图片的物理地址存储到硬盘里面。分布式肯定有问题!冗余AB服务器都存一份,或者搞个图片服务器。不可取。
  3. 流的方式储存到数据库里面。占用硬盘资源,需要转码对数据库的IO。
  • 运营系统

日志系统,风控系统,报表系统,调用链系统。

PS:看到电商是如此复杂是不是有点头疼,越往后业务越来越细分,运维的工作量越来越大。两个程序员可怕【改需求,改别人的代码】。分布式基本就是2个点,应用和数据库。

本文分享自微信公众号 - 编程坑太多(idig88),作者:诸葛阿明

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-06-02

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 『高级篇』docker容器来说什么是微服务(三)

    IT故事会
  • 『互联网架构』软件架构-分布式架构(14)

    那时候的容器之间都没有进行物理的隔离,都是部署在同一个jvm上的。所以久而久之,它们之间互相的耦合互相的依赖,业务之前有千丝万缕的,添加和修改增加新的业务的时候...

    IT故事会
  • 『高级篇』docker之微服务架构带来的问题(五)

    IT故事会
  • 谷歌升级版Transformer官方解读:更大、更强,解决长文本问题(开源)

    这是一个长期依赖性(long-range dependence)的例子,这是序列数据中常见的现象,处理许多现实世界的任务都必须理解这种依赖。

    新智元
  • 原创 | 《从0到1》并不值得中国科技公司效法

    本文由作者喻德武授权经管之家发表,转载以及商业使用请联系经管之家 《从0到1》说的确实很有道理,比如“10倍技术改进”和“做垄断性企业”,这些理念听上去确实让人...

    CDA数据分析师
  • R语言 相关系数混合可视化矩阵实现

    “ 相关系数可视化图让我们清晰了解变量之间的相关性,corrplot作为一个相关系数的多样式展示包,对我们的科研学习帮助巨大”

    拴小林
  • 特斯拉Model Y被曝存“重大缺陷”,安全带松动、后座椅未固定

    近日,特斯拉Model Y被曝光存在“重大缺陷”,包括安全带松动,后座椅未固定在底座上等问题,一些消费者也因此拒绝接受特斯拉所交付的该款车型。

    镁客网
  • PHP从数据库提取并显示数据的典型代码

    PHP从数据库提取并显示数据的典型代码如下: if ($res=mysql_query($sql)) { //数据库查询执行成功 ...

    似水的流年
  • PHP从数据库提取并显示数据的典型代码

    似水的流年
  • 共旋坐标法( 三 ) 算例

    为计算方便,根据对称性取半结构,且刻意将初始刚度设为1,便于观察。取半结构之后,自由度只有一个,用Excel也能算了。当外荷载较小时,不会出现“跳跃”...

    fem178

扫码关注云+社区

领取腾讯云代金券