接口服务规划的个人想法

遇到的问题:

  1. 过去一年事故频发
  2. 事故恢复时间过长
  3. 对事故现场没有很好的取证,不便于日后的分析
  4. 架构模块在使用的时候没有实质性对产生影响做分析,带有盲目性

解决方案的个人想法:

  1. 容灾:
    1. 关键参数
      1. NRO - 网络恢复目标(灾难后的网络恢复时间)
      2. RPO - 恢复点目标 (灾难前最后一次备份的时间,数据丢失)
      3. RTO - 时间恢复目标 (灾难后恢复物理系统环境的时间)
      4. RAP - 访问恢复目标(验证应用功能是否正常运行的时间)
  2. 保存现场
  3. 故障转移
  4. 事故恢复
  5. 逻辑优化

重构,借用工具。上线必须保证:httpunit功能测试,LoadRunner负载测试通过。

  1. 性能优化
  2. 后期优化

利用大数据分析,将业务问题转化为大数据问题。日志分析,监控异常,逻辑优化,响应时长分析,并发分析,数据恢复,保存现场数据,提供可持续改进的数据基础。

提供数据的频率:

  1. 流量异常:必须实时或近实时的进行
  2. 战略性业务业务决策的趋势分析:分析可采用批量模式
  3. 数据采集(后续)

反正我的blog除了乐视同事也没有别人看,不涉及信息安全。把接口架构图放在这里,以后好找:

不是我画的图果然就看起来高端大气上档次[汗]。性能优化是我的日常工作,可以慢慢来。如果遇到什么闹心的线上事故,建议看看

《打错一个字母-瘫痪半个互联网    亚马逊AWS的云存储服务S3超高错误率宕机事件》

《google.com宕机一小时》

《gitlab程序猿用一条错误命令误删了整个数据库》

心情会好很多!

今天开会确定的方案,这里备忘一下:

1 从上面架构图中可以看出安外联通的cbase只是做了一个冷备,会面临网络抖动的问题;马驹桥电信一旦故障,需要手动切换。冷备的机器虽然是正常写入的,但是数据没有经过检验,切换后的数据一致性隐患问题;跨机房的性能问题。所以我们决定改成联通和电信做一个物理隔离。这样做需要解决的问题:swiftq给联通和电信发消息,两端接受和处理消息的时机不一样,但是只有两段都更新成功后才能给各端发通知消息的更新,涉及到策略的问题。一旦一边更新失败,需要有补偿机制,补偿的策略问题。部署的复杂性提高,合理部署的问题。

2 memcache的mget在数据量大时性能急剧下降的问题。性能急剧下降时占用连接导致阻塞的问题。测试时需要注意key的数量以及value大小的双重变化影响。

3 cbase读写分离的问题

另外,我们是基础服务部门,应该可以不使用http协议来调用

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏花叔的专栏

解读一下一次性订阅消息

话说,微信的消息触达功能又“多”一项了---一次性订阅消息,也可以称她为“被动触达消息”,“被动”指的是开发者是被动的,因为这个消息必须由用户主动触发,而昨晚的...

56312
来自专栏TEG云端专业号的专栏

深入解析文件存储服务

文件存储服务平台更关注数据的存储和全局分布调度,同时支持全局排重和跨业务转存能力,在保证数据足够安全可靠的情况下做到成本收益最大化,另外平台可支撑任意数量、任意...

5163
来自专栏互联港湾

双活数据中心南北互通 互联港湾立足全国

952
来自专栏技术翻译

Kubernetes,Kafka事件采购架构模式和用例示例

随着当今业务和技术的快速变化,开发人员,数据科学家和IT运营部门正在共同构建具有新技术和动态架构的智能应用程序,因为它们具有灵活性,交付速度和可维护性。这篇文章...

992
来自专栏Albert陈凯

2018-06-21 Java技术栈知识小全--东西有点多,很有料

原文地址:https://github.com/aalansehaiyang/technology-talk

943
来自专栏FreeBuf

FireEye报告:揭露新型工控系统恶意软件TRITON

Mandiant最近针对中东某企业关键基础设施遭受的攻击事件进行了安全响应,攻击者通过部署特制的恶意软件来控制目标工业安全系统,由于工业安全系统具备对工控系统的...

1975
来自专栏程序人生

Docker hackathon, teamspark 及团队协作软件设计上的思考

这个周末我参加了docker hackathon,一个旨在为docker 2015大会暖场的编程马拉松。大赛在旧金山Mission St.上的万豪举行,硕大的餐...

2903
来自专栏腾讯大数据的专栏

守护客户数据价值:企业级NewSQL HTAP分布式云TBase架构详解

2706
来自专栏即时通讯技术

网络编程懒人入门(六):史上最通俗的集线器、交换机、路由器功能原理入门

即时通讯网整理了大量的网络编程类基础文章和资料,包括《TCP/IP协议 卷1》、《[通俗易懂]深入理解TCP协议》系列、《网络编程懒人入门》系列、《不为人知的网...

853
来自专栏鹅厂网事

数据中心间网络SDN解决思路探讨 ( 下集 )

上集提到了我们DCI SDN背景信息,我们在实际运营上遇到的一些困惑,以及我们针对运营中看到的问题,提出了SDN方向解决思路。那么下集我们一起窥探里面用到的实...

19710

扫码关注云+社区