数据中心基础与服务探讨

主要分享三个内容:

  • 数据中心简介 —— 了解 IDC 的架构;
  • 运维服务与人员配置探讨;
  • 案例讨论,外包服务怎样才能更好的做到双赢?

数据中心基础架构

谈到数据中心,一般都会谈及风火水电;谈到数据中心的配置,一般会谈到 N 、N+1 、2N+1 等,这些关系到数据中心的投资成本和客户的高可用性。

配电系统

空调系统

消防系统

数据中心有两点需要特别注意:

  • 当听到声光报警时,一定要第一时间撤出机房;
  • 不要去随便触碰数据中心。

但国外的数据中心有可能不采用气体灭火,直接用水喷淋。他们认为,人的安全比设备的安全要更重要,所以采用了传统的水喷淋,这是第一点。第二点就是他们在 IT 架构上比较完善,由于机房在初期的冗余设计做的比较好,即使单个 IDC 出问题了,也不会影响业务的运转。这可能也是国内外的理念不同,国内的主要还是通过气体来进行灭火。

监控系统

监控系统,包含了多个方面的监控,如视频监控,一般现在会保留 90 天的数据,同时也有相应的门禁防卫系统、指纹掌纹识别等,都是基础配置。

运维工作与服务、人员优化探讨

大家可能不知道,数据中心运维工作起码有 100 - 200 项。那么如何确保运维的标准化?如何进行运维服务的优化提升?数据中心的运维人员如何进行配比?

我们探讨下面几个场景:

  • BAT 客户。比如腾讯,一般现场有驻场团队,都是由腾讯场驻场团队来完成;
  • 现在很多成熟的互联网公司,大多数都集中在北京、上海等地。这类公司不一定有现成的驻场团队,但是他们有专业的运营团队,同时部署规划做得非常好;
  • 南方的一些地方。南方其实是创业比较好的地方,所以也有很多草根公司是在这里成长起来。南方的公司比较实在,会有多点部署。同时,针对业务部署和业务发展情况,他们更希望把这部分服务交给现场的服务方来实施。

大家可以看到,上图是基础运维服务的一部分。服务的标准化,我们用一个案例来分析:

重启大家可能会认为是比较简单的操作,但其实也可以把每项工作细化,然后形成标准。上图是经过我们细化后的重启服务,总共有 10 个步骤。在形成最佳实践后,你可以把每项工作都按照这样细分,再打乱让员工排序。通过一段时间的训练,当员工接到一个操作单时,自然而然就会形成条件反射,用最标准的流程去操作授权。

在标准之后,就要开始考虑优化,这里我们有引进两个概念:

  • 标准工时 —— 通过 20 年的运维数据加权得出的合理值,我们认为员工能够在一定时间完成的用时;
  • 实际用时 —— 员工在完成每一项工作后的实际时间。

上图的表格是一个示例,比如一个员工的工作记录汇总。根据这些我们就能看出员工的工作项目、工作量、以及工作饱和度,并可参考此项来确定员工相应的绩效和需要优化的地方。

有趣的外包服务

大家对数据中心的了解,大部分集中在所托管的数据中心里。但我们服务的不仅仅是现有客户,其实还要做一些服务输出。我想在这里跟大家分享一个对多节点、分布式部署用户比较有借鉴意义的案例 —— 这项服务定义为人员输出的云服务。

案例中的公司在全国有 80 多个数据中心,在全国 20 个省份有 94 个节点,那么如果这家公司想在短期内完成多节点的调整和部署,需要面临很多问题。比如在短时间内和多家合作的公司进行沟通,需要把团队派到各地去实施,整体的人员参与成本非常高,人力压力也非常大。而问题在于,这家公司根本就没那么多人,满足不了这么大的部署。

而对于有全国部署的公司来说,就有以下几点好处:

  • 可以在一周内同时完成几十个数据中心的人员调配部署。整个服务标准统一、部署质量一致、部署效率高,既便捷又高效;
  • 就近派人节约时间成本、差旅成本;
  • 拥有数据最新的同步数据,不用担心人员流失而造成部署的延误。

接口非常简单,用户只需要对口这边一个项目经理,项目经理会对口各个区域负责人,各个区域负责人会协调各个区域的支撑团队完成工作,所以整个下来就会非常的顺畅。

上图是客户提出的一些需求。比如客户不用自己设库房,所有的服务器统一都会寄到指定的地方,会在用户有需求的时候,做设备的初始化配置。然后用户只需要填预上架表,就可以通过指定的合作物流把设备发到指定地点,同时进行设备的上架跟梳理。做完后,工程师会实时填写上架的图表并将信息验收表转交给客户。

Q:大机房的 DDOS 都是怎么防护的?

A:大机房的 DDOS 防御分两种:一种是通过类似电信云堤的技术做防御,另一种分几个层面,1.自有机房,拼的是出口;2.跟运营商合作,允许添加权限,可以自己操作;不过如果是重点业务,我建议最好还是购买相应的流量清洗产品。

另外,DDOS 其实有真正的动态 BGP 会非常好,动态 BGP 的好处是可以只跟某一运营商合作防 DDOS ,之后把攻击的流量通过 BGP 导到大出口的池子里,就可以实现防御。

原文发布于微信公众号 - IT技术精选文摘(ITHK01)

原文发表时间:2018-03-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏北京马哥教育

面试 Linux 运维工作至少需要知道哪些知识?

知乎上有这样一个问题:一个新手面试 Linux 运维工作至少需要知道哪些知识?其中有一个答案对这一话题的解读非常深入,今天特别分享给大家。

25000
来自专栏北京马哥教育

运维工程师的职责和前景

运维中关键技术点解剖:1 大量高并发网站的设计方案 ;2 高可靠、高可伸缩性网络架构设计;3 网站安全问题,如何避免被黑?4 南北互联问题,动态CDN解决方案;...

46250
来自专栏ytkah

林兴爆料小程序很快可以支持各个 App 直接打开小程序

23720
来自专栏大数据文摘

谷歌历史上18项失败的产品

232120
来自专栏BestSDK

3个方法2个准则,让你玩转小程序

2007年1月9号,乔布斯发布了第一代IPhone手机,从此拉开了移动互联网的大幕,十年后,2017年1月9日,微信小程序正式问世,张小龙选择这个时间点推出小程...

38280
来自专栏知晓程序

微信悄悄上线的 2 个小程序,暗藏一统社交电商的野心

15040
来自专栏互联网数据官iCDO

做营销的你,用对数据分析工具了吗?

一个流程会很容易让人养成一个习惯,而若无意识或干预的话,习惯可能就不会再被改变了。

18310
来自专栏互联网高可用架构

从点线面体谈开发到架构师的转型【完整版】

17150
来自专栏互联网数据官iCDO

无需购买广告,25种方法教你驱动更多的电商流量(下)

促使紧迫感的内容效果有14%的点击打开率,59%的交易点击率,并且是其他营销邮件转化率的两倍。

9620
来自专栏即时通讯技术

腾讯技术分享:微信小程序音视频技术背后的故事

微信小程序自2017年1月9日正式对外公布以来,越来越受到关注和重视,小程序上的各种技术体验也越来越丰富。而音视频作为高速移动网络时代下增长最快的应用形式之一,...

50020

扫码关注云+社区

领取腾讯云代金券