前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >《同心协契,砥砺前行》-2019年腾讯数据中心技能争霸赛

《同心协契,砥砺前行》-2019年腾讯数据中心技能争霸赛

作者头像
腾讯数据中心
发布2020-01-03 14:11:04
7150
发布2020-01-03 14:11:04
举报
文章被收录于专栏:腾讯数据中心腾讯数据中心

腾讯数据中心技能争霸赛

We Are Champions

2019年12月20日,第二届“腾讯数据中心技能争霸赛”总决赛,在深圳腾讯滨海大厦圆满落下帷幕。7支参加总决赛的队伍(共28人)从全国数百余位IT工程师中脱颖而出,角逐最终团体总冠军和四个单项冠军(服务器、网络、资产、安全)。

“数据中心技能争霸赛”是腾讯数据中心一线运维团队每年一度的技术盛会。今年,我们在上届大赛的基础上进行了赛制升级。不仅增加了“安全”这个全新竞赛单元;而且还将“服务器”、“网络”、“资产”、“安全”这四个竞赛单元,融合在一整个实操比赛中,来考验参赛团队的联合作战能力。

同时,在考点的设置上紧跟实际运营需求,将腾讯云服务器运维、云网络排障、部件资产管理、数据中心运营安全等实际工作场景中的重点和难点巧妙的融入到比赛中;既考验了选手们解决日常实际问题的能力,也考验了选手们相关知识的深度与广度。

● 比赛集锦● 

数据中心安全技能比赛

数据中心运维,安全永远是放在首位的。无论是人身安全、信息安全、资产安全还是操作安全,每一项都不容忽视!

猜猜看,我们的考官给选手们出的安全考题是什么,让我们的选手一进机房就弄得一头雾水?

原来是“人员机架触电急救”——模拟有人在机房触电后如何处理。

喂喂喂,这位选手,你就直接这样开始去救人么?是不是忘了点什么?瞧把旁边的小姐姐急的。

划重点啦:首先应迅速切断电源或通过绝缘体将触电人员与带电体隔离。救人虽然紧急,但也需要先保护好自己。

现在,再开始按照心肺复苏的八步法则实施抢救吧!(PS:最后一位兄弟,你也是够投入的呀!)

服务器技能比赛

从2018年起,腾讯开始大规模使用自研服务器,这些服务器是根据腾讯业务特性进行专项设计,再委托代工厂制造。代工厂的优势在于生产,其并不具备设备的维保能力。海量自研服务器的维保重任便落到了数据中心运维团队的肩上。

今年的大赛,服务器的考官们,不单单关注选手们硬件的维修能力,还将OS和网络联调一并纳入到考点中,共计设置了4个硬件故障和3系统故障考点。

这位小哥哥,直接从硬件入手,一番“望闻问切”后,找到了故障点,美中不足的是用时较长。

下面这位选手一看就是“老司机”,刚到机房就用自己的笔记本连接到服务器的带外端口,通过查看BMC日志,让真相水落石出。

面对复杂的故障场景,一个人搞不定?嗯,赶紧叫小伙伴来帮忙。人多力量大,这次我们玩的是团战。

此外,关于系统和网络联调排障,考官选择了在云架构中常用的网络Bonding这个场景来考验选手。系统中网卡的配置文件异常,交换机的端口速率设定,服务器的路由指向,这些问题点单个拿出来,可能都不会对我们这些全国精英构成挑战;但是在时间的压力下,同时叠加三个故障点,让很多选手铩羽而归。

网络技能比赛

网络方面的比赛,更是一波三折。选手们看到第一个赛题,心中一阵窃喜——居然是交换机更换。没错,技术上的确没有难度,考的是大家的速度和规范。网络故障处理,早一分钟恢复,早一分钟减少对用户的影响。

于是,马不停蹄到机房确认故障机的信息;飞奔到库房找资产小姐姐领用备机;立马回到办公室开始刷机导配置......一气呵成的背后是多年一线战斗经历的缩影。

然而,真正的考验在第二道试题,请听题:

请修改设备配置使得两台交换机的bgp协议能正常建立,同时服务器最终要能ping通TEST-02的loopback100口。并针对上述案例输出一个故障案例复盘报告。

小编过期的CCNP水平已经解释不了这么高级的话题了。最终的结果是,仅有三支团队在规定的时间内,完成了网络连通性调试。尤其是来自天津数据中心的队伍,在4个小伙的共同努力下,在最后一分钟调通网络。连考官都不由的为他们祝贺!

资产技能比赛

资产管理,是数据中心运维中最容易为人忽视的角色,但随着自研服务器投产,资产管理员逐渐成为我们部件运营成本的守夜人。所有服务器的部件在收发货时需仔细确认是否有物理损坏。本次大赛除了配合服务器、网络故障处理进行备件出入库外,还有一项“寻找部件损坏点”的考验。

考官们将实际运营中的主板、CPU、阵列卡带到了赛场,资产管理员们需要在这3个部件中,找到9个物理损坏点。大家一起来试试?

知识抢答比赛

知识抢答比赛,规则看似简单粗暴,实则考验各参赛团队在服务器、网络、资产、安全等方面专业知识的深度与广度,还有队员之间是否能默契配合。在评委考官的各种挖坑下,若不是有真才实学将知识点烂熟于心,分分钟给其他队伍送去神助攻。

通过实操比赛,真刀真枪的锻炼队伍,让各运维团队同台竞技;大家在实战中得到检验,看到了自身能力与客户要求之间的差距,看到了自身水平与行业精英之间的差距;同时,也希望发掘高技术水平人才,鼓励他们成长为团队的标杆和榜样,获得更多的荣誉和激励。最后,在团队内形成持续学习的技术氛围,打造工匠精神,去打磨技术、研究技术。

一个优秀的数据中心,离不开一个优秀的运维团队。对数据中心运维人才的培养,我们一直在探索。举办这样的赛事,正是希望培育高水准的一线运维人才,为腾讯各类业务安全稳定的运行保驾护航,为腾讯云打造一支“招之则来,来之能战,战之必胜”的队伍。

荣耀时刻

Moment Of Glory

●团体冠军-广深数据中心联队 ●

华南古德阳、覃淑娴、李仕彬、金凯(左起)

●服务器技能单项冠军-曾检历 ●

广州服务器工程师曾检历

●网络技能单项冠军-李天伟 ●

成都网络工程师李天伟

●资产技能单项冠军-黄婷婷 ●

成都资产管理工程师黄婷婷

●安全技能单项冠军-金凯 ●

深圳安全管理员金凯

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-12-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯数据中心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
业务风险情报
业务风险情报(Business Risk Intelligence,BRI)为您提供全面、实时、精准的业务风险情报服务。通过简单的 API 接入,您即可获取业务中 IP、号码、APP、URL 等的画像数据,对其风险进行精确评估,做到对业务风险、黑产攻击实时感知、评估、应对、止损。您也可利用业务风险情报服务搭建或完善自身的风控体系,补充自身风险情报数据,提升对风险的感知、应对能力。BRI 支持按需付费,您可根据您的需求,选取不同的套餐,更易优化成本。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档