云时代下的IDC联合运营

Pony说过,腾讯把半条命交给了合作伙伴。这句话,同样用于形容腾讯和支撑腾讯业务的IDC运营商。的确,稳定可靠的IDC,是腾讯业务的半条生命线.

云对IDC的压力

近几年,随着云服务商的兴起,及云计算的日趋成熟,集中式云计算已慢慢成为主流的趋势,越来越多的中小型公司不再自行购买服务器,直接购买云服务来完成自身的IT支撑业务。

大型互联网公司的IDC,从托管自身业务起家,支撑其海量的互联网业务及产品,服务于亿万网民。慢慢的,为其业务支撑的建设的IDC及网络、积累的技术和经验,已变成了IDC业界难得的资源。因此大型互联网公司也顺势把自己的IDC开放出来,对外提供云服务。

托管在云上的都是商业客户,大多数对业务可用性要求非常高。IDC通过云的方式开放以后,这种压力也自然传递给了IDC侧,一旦IDC出现较大的故障,很可能立刻变成公关事件。和以前纯内部业务的时代,现在的IDC运营商为此也面临更大的压力。

IDC运营经验积累不易

数据中心整套系统非常复杂,包括大楼建筑、电力系统、空调系统、消防系统、防雷系统,安全系统、监控系统、网络系统等,产品多样复杂,单个系统的维护是门大学问。此外数据中心的各个系统又是联动的整体,不同子系统都相互关联,相互影响。例如市电中断导致空调系统的临时中断,消防系统的误报警导致空调自动控制系统的锁死,任何一个系统的小问题都可能影响到整个机房关键系统的宕机,这直接对数据中心的整体可靠性管理带来巨大的挑战。

在整个数据中心的安全保障需要整体管理和执行,自动化系统和人工预案的并重。运营的可靠性是贯穿整个生命周期的,前期建设埋下隐患,直接影响到运营。因此经验的沉淀至关重要,而且不简单,一个可靠的数据中心的经验沉淀需要很多年。一个合格的数据中心技术人员,其技术积累积累需要走很多年。4个9的保障难,5个9保障更难。

互联网云的对IDC的使命

IDC如何提升运营水平,保障业务的可用性?通过培训?通过找第三方咨询顾问?通过数据中心之间的人员流动和互相挖角?

BAT这样的大型互联网公司,都经历了租用,合建,自建IDC的历程,其IDC规模从几十个到百多个,跨多个省市,多个IDC运营商,经验遍布全球。各个IDC的基础设施情况不同,运营水平有高有低,一路走来,都经历过不少的酸甜苦辣。

拿腾讯来说,腾讯自QQ业务开始,历程15年的IDC建设及运营经验,服务器量从数万到数十万,扛住了海量业务的挑战,而且在大量的运维故障处理、运营优化工作中积累了丰富而宝贵的经验。为了保障业务的可靠性运营,腾讯早些年开始慢慢摸索与各大运营商联合运营的机制,借助腾讯从百家提炼总结出来的经验,以预防故障作为出发点,尤其是与一线的机房运维团队开了密切的交流与学习,分享经验,传递最佳实践等。同时慢慢开始双方的联合巡检、联合排查、联合整治的工作。一个故障,不要在其他IDC重现,一个隐患,能引起其余IDC的重视。就以这样“开放、分享、交流”出发点,联合运营的模式赢得了多方的认可,也颇见成效。在一个共赢的平台上,各方共享了高可靠IDC保障的技能,迅速学习了业界的技术经验和最佳实践。

只有与下游的IDC密切联合起来,才能保障上游的业务。腾讯除了自身积累的经验分享给IDC服务商之外,还把“联合运营”提升到更高的层次,上升到双方高效沟通、规范流程体系、数据量化、联合优化、知识共享、平台对接等。一方面保障了腾讯的业务,同时各大运营商也随之得到不断进步,创造多方共赢。随着联合运营的广泛落地,腾讯最近几年在基础设施层面的重大故障几乎为零,与腾讯合作的众多IDC的运营水平也随之得到显著提升。

像腾讯、百度、阿里这样,拥有海量IDC的互联网企业,借助自身业务运营的经验,把下游的IDC资源、网络资源、IT资源等整合,以云的方式把IDC开放出来,为上游的云客户提供计算服务。云市场需求越大,IDC的需求也越大。也正因为这样,云革命的年代,这些大型的互联网公司在某种意义上被赋予了更高的使命,通过“云”这个特殊的媒介,与下游产业每一家IDC形成天然的结盟,相互分享经验,完善运营体系,落实最佳实践,进而实现多方共赢,最后促进整个产业的进步。

到目前,与腾讯合作的IDC基本上都参与到了腾讯的联合运营,我们非常高兴看到许多运营商也持开放的态度,一同走在共赢的道路上。在云革命时代,联合运营被赋予了更大的使命,云和IDC运营商的联合行动也必然更加紧密,双方更深入联合起来共同保障对外的云服务。我们也有理由相信,唯有共同前行,参与生态,多方共同努力,整个行业的云服务一定会绽放光彩。

版权声明:本文为腾讯数据中心原创,欢迎转载,转载需标明出处。版权均属“深圳市腾讯计算机系统有限公司”所有,未经官方授权,不得使用。

本文部分图片来自互联网,如果涉及到版权问题,请联系TIDC@tencent.com。

本文分享自微信公众号 - 腾讯数据中心(Tencent_IDC)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2015-07-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据和云

MySQL智能运维与实践,看关系型数据库如何优雅应对云时代

随着互联网场景的导入,非结构化的海量数据给传统数据库的处理能力带来了极大的挑战,作为最受欢迎的开源关系型数据库,MySQL一步步地占领了原有商业数据库市场。如...

39670
来自专栏数据和云

那些被你忽略的性能 - Oracle Redo的产生场景及优化

? 冷菠 冷菠,资深DBA,著有《Oracle高性能自动化运维》,有近10年的数据库运维、团队管理以及培训经验。擅长数据库备份恢复、数据库性能诊断优化以及数据...

35770
来自专栏数据和云

问诊白求恩之性能分析:把握趋势比你更了解你的库

如果问你,你的数据库性能如何,你会怎么回答呢? DBA 甲: db file sequential read等待事件经常出现,不知道什么原因。 DBA 乙:平常...

38450
来自专栏数据和云

Oracle12.2 多租户环境下的授权管理

题记:在多租户环境中,权限可以全局授予整个CDB,一个应用容器数据库(application container),或者单个的PDB。在多租户环境下,往往牵一发...

31970
来自专栏数据和云

超实用运维经验:TEMP表空间不足、热块竞争经典案例

作者介绍 ? 邓秋爽 云和恩墨技术专家,擅长于SQL tuning、troubleshooting 系统运行过程中可能遇见各种各样的性能问题,如果仅仅是当前系统...

35950
来自专栏数据和云

表分区“拖出”的性能Error

作者介绍: 曾令军,云和恩墨技术专家,2009年开始接触ORACLE数据库,8年数据库运维经验。思维敏捷,擅长于数据库开发、解决棘手的数据库故障和性能问题。服务...

35070
来自专栏数据和云

SQL执行计划 - 查询转换hint的介绍和使用技巧

? 冷菠 冷菠,资深DBA,著有《Oracle高性能自动化运维》,有近10年的数据库运维、团队管理以及培训经验。擅长数据库备份恢复、数据库性能诊断优化以及数据...

412110
来自专栏数据和云

盘点 Oracle 11g 中新特性带来的10大性能影响(上)

Oracle的任何一个新版本,总是会带来大量引人瞩目的新特性,但是往往在这些新特性引入之初,首先引起的是一些麻烦,因为对于新技术的不了解、因为对于旧环境的不适应...

37250
来自专栏数据和云

为什么用尽了办法你的系统性能还是不见改善

随着业务数据的增长,以及新业务的推出,很多企业都面临着系统性能的问题,并且日益凸显。我们曾遇到很多这样的用户,似乎用尽了所有招数,但性能就是不见改善,问题到底出...

39490
来自专栏数据和云

运维技巧 - 活用临时表隔离冷热数据

编辑手记:Oracle给了我们很多工具,在日常数据库管理中活用这些工具方可发挥最大效能。 作者简介: 张洪涛 富士康 DBA 在数据库监控过程中发现考勤数据...

43850

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励