【备战双十一】平台

双十一就是电商行业的一次大考,作为平台组成员,他们的考题更多的是为全公司提供的服务组件是否可以扛得住大促的压力,为商城的兄弟们输送弹药,稳住地基。

通宵达旦讨论方案的战士们

(据说晚上来的思路更清晰哦~)

双十一,一个举国同庆的日子,but作为一只“猿”,却是最为忙碌和不眠的日子。

像阅兵彩排一样一轮又一轮重复这个过程,焦虑、紧张、刺激,五味杂陈,这既是对每个团队的检验,也是个人的一次升华,无论经验能力还是心态责任,都将经历空前的洗礼。

Redis

1、redis双机房数据同步方案落地;

2、配合中台商城进行redis代理的升级;

3、redis集群以及代理的扩容;

4、宕机演练,丢失部分数据;

5、梳理redis集群节点的物理机分布,进行优化,预计11月5日晚再来一次宕机演练。

在双十一期间Redis为各个业务系统可以支撑起稳定的高并发、低延迟的业务场景提供了技术保障,保证双十一业务系统在巨大的流量的情况下依然拥有丝滑的体验哦~

统一监控

1、对监控的代码重新review并优化,包括对应用内每个线程池的使用、单个监控点的来源做了限制;

2、存储上,监控依赖的hbase和ES集群存储单独部署,保证大促期间监控使用的稳定性;

3、监控的单个节点灰度,逐步提高负载,压测出系统瓶颈,反复优化测试,提升系统吞吐5-10倍。

在开发大促期间监控各系统系统,保证告警及时有效,给研发小哥哥满满的安全感。

自然语言系统

1、压测性能达到了较好的水平,并发150,平均响应时间60ms之内,tps1500左右;

2、作为双十一的先锋,承但了全国110家左右,52w,将近50%的任务。

通过系统算法的升级,在意图识别上的进一步优化,助力双十一,做好双十一的先锋!打好第一枪!

基础服务

提前扩容优化:

1、TMQ消息服务提前完成集群与服务节点扩容以及数据均衡迁移,完成一轮集群节点故障灾难演练;

2、大数据采集系统完成集群与服务节点扩容,排查健全核心任务报警机制;

3、推荐系统接口完成调用中台服务性能优化,调用中台接口改为调用推荐业务聚合缓存系统并增加了降级开关;

4、开发推荐业务聚合缓存系统,全量缓存商品库存信息,减少对中台服务调用,并增加调用中台开关控制。

为迎接大批量的订单,基础服务系统协助各领域完成扩容排查等工作,为各领域提供技术支持,降低风险。

智能推荐

1.将之前单一的商品,服务推荐改为推商品+服务的大融合推荐;

2.新增了小程序门店个性化推荐;

3.在大融合推荐的基础上重新整合了首页,购物车,商祥推荐策略。

为了在双11为用户提供全方面个性化服务,推荐的一系列重大改进措施,为大家带来五彩缤纷的购物体验。

搜索

1、增加系统降级开关;

2、不同业务数据分集群存放;

3、索引数据备份到hdfs,防止意外事故导致数据丢失

4、通过测试人员组织的压测,分析了系统各个接口的性能指标,并做了系统降级的演练。

保障双十一期间孩子王各子系统的搜索服务,让用户拥有顺畅便捷的购买流程,搜索组信心满满!

k8s集群

1、资源提前扩容,接入系统资源使用情况收集;

2、集群各项基础配置检测;

3、发布系统限制发版功能开启;

4、验证码系统提前扩容。

双十一期间让各个接入应用可以在负载均衡界面查看域名负载实时变化,应对压力时系统提供秒级扩容服务,确保核心系统平稳应对流量高峰,做大家最坚强的后盾!

作为业务部门最坚强的后盾,面对公司业务规模的不断膨胀,相信今年各个系统的流量压力一定会再上一个台阶,更相信平台一年来的努力一定可以让公司各系统无惧压力平稳运行。

大家加油!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181103G1G4GC00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券