前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >重磅升级,全新出发

重磅升级,全新出发

作者头像
腾讯数据中心
发布2021-08-17 10:10:20
6880
发布2021-08-17 10:10:20
举报
文章被收录于专栏:腾讯数据中心

重磅

发布

近日,腾讯数据中心服务台在总部深圳全新升级投产,该平台是目前国内最大规模的数据中心集中化运营服务平台,支撑腾讯全球100+数据中心及百万级IT设备的运营服务工作;标志着腾讯数据中心正在加速向集中化、平台化、智能化运营方向升级和发展。

腾讯数据中心服务台综合服务大厅

当前,腾讯云在全球数十个国家和地区建立起100+中大型数据中心,支撑百万级IT设备的运营管理。数据中心体量大、分布广、运营管理方式多样化等特点,给打造腾讯云数据中心全球统一标准服务带来了巨大的挑战。

早在2018年,腾讯数据中心服务台(ISC)应运而生。从数据中心基础设施集中化监控开始,不断拓展运营和服务方向;建立了IDC集中化运营、IT综合服务支持及腾讯IDC云服务门户三个板块;作为腾讯数据中心运营的中台,依托腾讯智维(Tnebula)掌握实时的运营动态,实现对全球各大数据中心的集中化运营和服务支持。

在处理海量IDC运营数据的同时,基于最佳实践不断对平台进行优化和持续改进。随着平台版本的迭代,平台可用性、可靠性的不断提升,腾讯数据中心运营管理,实现了从量变到质变的升华——由传统的属地化管理向平台化、集中化、智能化发展。

   基于主动监控的

数据中心集中化运营

通过三年的发展,腾讯数据中心服务台(ISC)基本实现了对国内各数据中心的设施监控接入。从初期的以接入动环数据为主(智维1.0),到目前接入自研的本地智维数据为主(大园区智维2.0),一步步解决了DCIM平台的监控有效性和平台可靠性问题,推动智维平台的实用化,为后续的自动化及智能化运营打下坚实基础。

01

可靠的设施集中监控

告警质量决定了监控的实用性,经过长期运营、改进及提升,将经验和标准固化在智维2.0平台,平台实用化方面有了质的提升。

2021年服务台日均处理告警超过1万条,经过告警收敛后,通过事件单形式派发给各地数据中心进行检查、校验处理、反馈和总结,形成闭环持续迭代改进。

02

实时风险管控,打造运营的最后一道防线

设施系统的割接、操作及变更历来是数据中心运营高风险时段,通过对变更告警的隔离式监控、操作过程关键点check、异常监控的及时发现和第一时间启动应急响应,担负起“吹哨人”的职责,有效的降低了设施变更的风险。

03

基础设施+IT集中运营联动

通过建立数据中心基础设施监控告警与IT设备监控告警关联逻辑关系,实现基础设施运营与IT设备运营的联动。从而实现对基础设施变更、事件带来的业务影响的快速、准确分析和评估,进而提升业务应急响应保障的及时性。

7*24主动监控运营

此外,针对地震、台风等自然灾害,新冠疫情等公共卫生事件,重大节日业务保障等,腾讯数据中心服务台发挥平台化运营的优势,联动腾讯全网各地数据中心,启动相关流程和预案,为海量业务运营保驾护航。

统筹IDC服务站运营

7*24全方位服务支持

腾讯数据中心各园区现场部署着数千人的设施、IT运维团队,服务台统一负责对所有运维团队的技术能力进行培训、对管理策略变化进行传达宣贯,保障现场运维人员对设备的抢修、维护、维保能力。

服务器运维技术支持

同时服务台作为腾讯数据中心运维支持和调度中心,为腾讯全球一线服务站工程师、驻场工程师和业务运维同事提供故障处理、工单监控跟踪、技术支持等7*24综合运营服务。

客户服务统一入口

7*24全栈售后支持

随着数据中心和服务器自研产品的逐步成熟,腾讯智维、miniTB、TMDC、T-Block以及星星海系列服务器等产品均实现对客户的交付,腾讯数据中心服务台作为面向客户服务的统一窗口,提供咨询、报修、技术支持、需求响应等服务支持的工作。

为满足客户的服务请求,腾讯数据中心官网提供统一服务入口——而服务台正是该服务入口的支撑团队,通过集中调度全球数百个运维服务站的资源,从而实现快速响应满足客户需求。

腾讯数据中心官网https://tidc.tencent.com

随着我国数字经济的飞速发展,腾讯近年在华南、华东、华北、西南布局了超大规模数据中心集群,部署腾讯第四代数据中心Tblock。在新的格局下,构建了三级运营架构体系——总部级ISC+城市级ECC+楼宇级LMC,并将致力于探索基于超大规模数据中心集群的设备生命周期管理、能效管理、产品质量管理、数据中心架构优化等课题。

腾讯数据中心集群布局

20余年来,腾讯数据中心始终致力于先进的数据中心技术、运营管理的探索与追求。腾讯数据中心服务台,凝聚了腾讯IDCer二十余年的厚积薄发。随着腾讯数据中心服务台的全新升级,我们将开启下一个海量数据中心运营管理的新征程。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-08-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯数据中心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
应急响应服务
应急响应服务(Cybersecurity Incident Response Service,cirs)基于腾讯安全专家能力及多年的攻防对抗经验构建。对发生的安全事件进行响应处理,采取标准化可控的应急处理方案,发现云上资产的安全问题,还原黑客的攻击路径,对客户在受到黑客攻击后所造成的影响进行止损。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档