专栏首页腾讯数据中心磨砺,文火,慢熬,起锅前再加一点“匠料”

磨砺,文火,慢熬,起锅前再加一点“匠料”

引言

数据中心运营是一项复杂的系统性工作,涉及各类专业多达十余种。漫长的运营周期,赋予了一线运营人员专业专注、精益求精的工匠特质。每一次巡检、每一次维护、每一次变更的背后,都离不开对方案细节、操作步骤、运营影响的全方位考量,而工匠精神正是在这些微小的细节中孕育和萌发。日复一日纷繁复杂的运营维护,不仅磨砺了一线运营人员精深的功底,更是激励和引导着他们立足一线、不断优化创新。

在多年的经验积累和技术沉淀过程中,腾讯数据中心运营人员正在不断推动一线运营的革新。从数据中心架构设计创新,到设施设备、辅助工具优化改良,目前已经累计申请数据中心相关专利60余件,获得专利授权近40件。“以匠心持续深耕专业技术,以创新不断打磨运营能力”,正在成为腾讯数据中心对“工匠型创新”精神的探索与追求。

本文将选取近三年来腾讯数据中心已经落地专利中的4项作为分享主题,希望以此为契机抛砖引玉,引起行业对一线运营优化创新的关注和重视;期待行业内出现更多的“匠士”,共同推动数据中心运营能力迈上新的台阶。

一种服务器辅助上架装置

随着服务器性能、硬件配置的不断提升,其重量也越来越大。以往普通服务器重量约20~30kg/台,而新型的高性能服务器已经提升至40~70kg/台。重量的成倍增加,给设备上架以及后期运维带来了极大的挑战;如果继续采用单纯的人工上架方式,不仅将占用更多的人力,而且存在设备跌落伤人的风险。随着腾讯数据中心运营的服务器超过百万大关,服务器上下架这一看似不起眼的工作场景,却已经成为了一线运营人员无法忽视的问题。

在此背景下,我们设计了一款服务器辅助上架装置,运营人员可将单台重量达50kg的服务器放置在承重台上,通过控制屏设定升降高度,由电机驱动传动机构,实现对服务器的升降,精度可达毫米级。当服务器到达指定高度后,由运营人员轻轻推送服务器进入机位即可。此外,该上架装置还设计包含:刹车限位、升降自锁与减速保护、人员辅助踏步、断电自锁保护等实用功能。该辅助上架装置已经申请发明专利,完成打样制造,并应用到机房运营中,在提升运营人员工作效率的同时,也进一步保障了人员和设备运营安全。

目前行业内从事服务器升降设备生产的公司稀少,其中ServerLift作为知名度较高的品牌,主要在海外售卖,而且价格较高。由腾讯数据中心研制、厂商共同生产的服务器辅助上架装置,其成本约为ServerLift同等产品的30%(随着设备量产,价格优势将更加突出)。此外,随着单台IT设备重量的进一步增加,我们已经开始着手研制液压式上架装置,有望达到200kg的承重目标,并能够适应不同机房环境的使用要求。

一种易维护式电池柜

电池柜、电池架作为存放蓄电池的结构体,通常并不为人所关注。往往真正出现蓄电池相关的问题时,才发现这些问题的背后与电池柜的设计有着千丝万缕的关系。基于过往的运营实践和故障案例,我们发现蓄电池更换困难蓄电池漏液风险这两个问题值得深入研究和探讨。于是,一款可以解决上述两个问题的易维护式电池柜应运而生。

蓄电池更换困难

通常单节蓄电池重量可达70kg,应用于模块化数据中心的电池柜通常配置5~6层,每层可放置4节电池。当蓄电池出现故障或到达使用寿命时,蓄电池的更换将极为困难,其中还隐藏着巨大的人身安全风险。通过设计抽拉式电池托盘,可从电池柜前后两侧抽拉;单方向层板具备200kg承重能力,带限位和锁定保护,可以完全承载2节蓄电池。同时,通过配合液压支撑小车,可以实现水平、竖直方向上的移动。

蓄电池漏液风险

蓄电池在长期运行过程中,一旦出现漏液,将极易腐蚀金属支架,严重时可能造成接地短路故障。为了解决漏液带来的风险,我们在接液盘中设计了支撑斜面,让漏液可以快速汇集到漏液孔。同时,设计引流管,将各层漏液孔通过软管统一汇集至底端接液盒中,实现对漏液的安全、快速排出。日常巡检时,也可将底端的接液盒抽取出来进行检查。

一种便于巡检的智能PDU

PDU作为末端电源的集中分配装置,直接向服务器、交换机等设备提供电力,是数据中心应用数量最多的设备之一。在长期运行过程中,PDU内部的接线端子可能出现松脱、老化等现象,导致线缆发热、损毁,进而引起PDU故障、机架掉电等。通过调研发现,现有的PDU设计通常难以发现上述运营隐患。

为了规避上述隐患,我们设计了一款带有可开关式透明盖的PDU,并配置温度检测模块。日常运营过程中,运营人员可在巡检时目视检查接线端子外观,也可以打开透明盖,使用点温枪/红外热成像仪进行温度扫描;而温度检测模块更进一步实现了对PDU运行的在线监测。

一种新型储油罐结构设计

柴油发电机组作为数据中心后备供电系统,在市电中断或异常时,需要能够快速投入并持续稳定工作,这背后也离不开供油系统的高可靠性。但在柴油发电机组实际运行过程中,我们发现由于柴油品质不一、柴油自身氧化、沉淀等因素带来的影响,将在储油罐底部形成杂质沉淀,导致油罐从顶部到底部的柴油品质逐渐下降。而储油罐在补充或抽取柴油过程中,由于油泵压力较大,容易将储油罐底部杂质和积水冲起,致使油罐顶部柴油品质下降。一旦杂质较多的柴油进入柴油发电机组,将导致柴油发电机组输出电压不稳定,严重时甚至可能导致柴油发电机组无法正常运行。此外,储油罐属于密闭空间,检修较为困难,底部杂质和积水难以有效排出。

因此,我们设计伞状的减压分流结构,用于减小柴油补充过程中对油罐底部沉积杂质的冲击;同时将出油口位置设计为弧形面,优先抽取上层柴油;并通过配置过滤阀,进一步过滤杂质。此外,为便于定期检查油品质量,设计独立的清油管道,确保有效排出储油罐底部杂质和积水。

结语

“天下大事,必作于细”。

就令萤火一般,也可以在黑暗里发一点光,不必等候炬火。此后如竟没有炬火,我们便是唯一的光。以上真的是鲁迅说的。

随着腾讯数据中心规模、体量的不断增加,坚守在一线的运营匠士正在经历着越来越多的新场景、新挑战。在未来,我们将继续秉持“工匠型创新”精神,通过不断细化运营思路;结合现场实际不断创新、改良已有产品技术,优化流程方法;用沉淀后的经验和技术,持续探索和实践,为数据中心的发展带去新的活力,也为数据中心运营创造更加广阔的想象空间。

本文分享自微信公众号 - 腾讯数据中心(Tencent_IDC),作者:IDC攻城狮

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-01-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Google对数据中心成本模型的分析——下

    (接上文《Google对数据中心成本模型的分析——上》) 三、案例分析 虽然变量繁多,但通过观察不同行业的小部分数据中心案例,仍有助于我们理解这些成本因素的影响...

    腾讯数据中心
  • 互联网数据中心运营发展及实践

    Kenny: 各位领导、各位专家、各位嘉宾,大家下午好! 先自我介绍一下,我叫郁智华,在腾讯负责数据中心运营工作。非常高兴今天有这个机会能够向在座各位嘉宾、领导...

    腾讯数据中心
  • 天津数据中心群英传——之呼风唤水篇(中)

    励炼之路: 空调系统的各位“大侠”桃园结义后,要想实现功成名就,长治久安,这可不是一件容易的事,一番苦心修炼,那是在所难免。 励炼一:机房温度恒定是如何炼成的?...

    腾讯数据中心
  • 架构畅想:如果以你所会去进行架构,会到哪一步?

    平台之大势何人能挡? 带着你的Net飞奔吧!http://www.cnblogs.com/dunitian/p/4822808.html 这边只是简单框一下,也...

    逸鹏
  • LVS-1.概述

    通过高性能网络或局域网互联的服务器集群正成为实现高可伸缩的、高可用网络服务的有效结构。

    悠扬前奏
  • NSCopying和NSCoding对象序列化反序列化基础详解你要知道的NSCopying、NSCoding协议及对象序列化和反序列化都在这里

    你要知道的NSCopying、NSCoding协议及对象序列化和反序列化都在这里 转载请注明出处 https://cloud.tencent.com/devel...

    WWWWDotPNG
  • 分布式系统中的线程与进程

      虽然进程构成了分布式系统中的基本组成单元,但是操作系统提供的用于构建分布式系统的进程在粒度上还是太大了,而就粒度而言,将每个进程细分为若干控制线程的形式则更...

    用户3003813
  • IHS称:数据中心的用户选择,白盒Dell EMC

    根据IHS Markit的数据显示,数据中心领域白盒服务器的采用已经超过了品牌服务器。

    SDNLAB
  • 标签制作软件如何制作水杯标签

    水杯大家肯定都用过,平时用来喝水,大家有没有关注过水杯上的标签,标签上会简单介绍水杯的名称,容量等信息,你知道水杯标签是如何制作的吗?闲话不多说,接下来小编就教...

    中琅软件
  • 关于网游分布式服务器的讨论?

    如题 请大家讨论一下网游服务器端结构设计方面的问题。 希望大家畅所欲言,能说说细节更好。 还有关于网络游戏其他方面的问题也可以。 在此先摘篇文章 随着网游从...

    李海彬

扫码关注云+社区

领取腾讯云代金券