前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【案例】谁说搬机房就一定要断网的?(二)

【案例】谁说搬机房就一定要断网的?(二)

作者头像
网络工程师笔记
发布2021-05-17 15:02:07
6250
发布2021-05-17 15:02:07
举报
文章被收录于专栏:网络工程师笔记

关注我们

摘要 /Abstract/

机房搬迁,肯定是要把机房里面运行的所有设备,包括交换路由、防火墙、服务器这些从老的机房下架,再把它们安装的新的机房里面。在设备搬运途中,设备肯定是要断电的。但如果有工程师对客户说,在搬机房的过程中能做到网络不中断,你信不信?

本案例就说一次二级中心机构的机房搬迁案例,在机房搬迁的时候,做到了整个网络业务未发生中断,新办公楼和老办公楼依然正常办公。那么,这个是如何做到的呢?本文就为读者来揭秘一下。这篇文章图示较多,配置较少,主要是学习风险规避的方式。

本文核心知识点:

1、不中断网络搬迁机房的方案设计;

03

搬迁工作

3.1、

第一天搬迁工作

当梁国武赶到巴中的时候,何书明他们已经把演练都做完了。那天晚上梁国武发现,省公司出了杨万青,就连他们省公司的大领导都去巴中了,说明客户对机房搬迁这件事情还是很重视的。梁国武拿着方案看了两遍,才知道所谓的“不断网的机房搬迁”原来就是一半一半的操作。

第二天一早,何书明就和梁国武到了客户现场,那个时候杨万青已经回去了。因为关机下线需要等到下午18:00以后,所以第一天白天的事情就是配合运营商调整线路,首先要调整的就是新、老办公地点的MSTP专线。

白天何书明就先去新办公地点检查专线,并上架办公网的楼层交换机,留下梁国武在老办公楼做配合工作。根据方案的要求,梁国武先把一台H3C 5560上架在老办公楼的机房里,然后把网线连接在上面。然后把需要测试的配置做在上面。第一天的临时交换机做如下测试:

新、老办公地点临时交换机H3C 5560的配置:

从原则上来说,Trunk上TAGGED的VLAN都需要配置互联地址进行测试。

等所有的TAGGED VLAN都测试通过以后,才具备开始实施搬迁机房的条件。

新办公地点的楼层交换机重新规划地址并配置:

生产网的交换机为利旧机,从老办公地点搬移到新办公地点,所以在配置上就需要修改一下网关的业务地址,并修改OSPF内的声明。

新办公地点的办公网的楼层交换机关键配置命令:

到了晚上18:00的时候,无防火墙区域的所有2号机就可以下线了,而冷备机在白天的时候就已经搬迁到新机房上架并且加电了。何书明把热机里面的配置往冷备机里面配置了一遍,保证冷备机和热机里面的配置是同步的。

到所有2号机在新办公地点,并且开启以后,就需要做如下的检查:

1、在新办公地点的测试机,ping省公司和总部的地址,必须能够保证长Ping不掉。这个就要求在测试机上提前准备好pinginfoView软件,尤其是办公网。

2、需要检查所有搬迁到新办公地点(新机房)的设备上的OSPF邻居,确保OSPF邻居都能正常建立,并且新机房内所有的专线都能正常连接。

第一天搬迁以后,网络的结构如下图所示:

3.2、

第二天的搬迁

第一天搬迁以后,只搬走了所有的2号机,并且有热转冷的操作。当然,已经转为冷备或者温备的设备,可以在白天就直接搬到新的办公地点,而在当前这种过渡的环境下,自然会有一些风险,尤其是,两台核心之间、包括RTP互联和同城网点汇聚交叉互联都只通过临时交换机,加上新、老办公地点之间的一条MSTP链路互联,这里需要特别注意。

白天实际上,梁国武跟何书明其实也没啥事,主要任务还是两个人一起在老办公地点的机房进行值守。吃了午饭,俩人就去休息了,因为他们都知道,晚上将要关闭所有的1号机,而所有流量都压在1号机上面的,关闭1号机的风险那可是比关闭2号机的风险要大的。所以他们俩简单商量了一下,决定是先关闭1号核心上的接口,确认流量稳定以后再断开电源。

这天晚上到了18:00,1号机的下架工作就正式开始了,按照何书明和梁国武事先商量好的,首先在核心-1上关闭的就是上联接口,只有上联先稳定了,再关闭下面的下联接口才能放心稳定。

在所有的1号机在新的办公地点机房安装好以后,网络的结构就要逐步开始恢复了。在这个过程中,先恢复的是上联,然后再恢复核心,逐步往下进行恢复。而外联区域也在这个晚上在新的办公地点内进行安装。主要业务的测试在当天晚上就测试了,一切顺利,而外联的测试也要等到第二天早上,各个外联单位上班以后才能看到测试的效果。

搬迁以后,老办公地点就降级成一个同城网点了,在这里需要一台路由器作为与新办公地点同城汇聚的互联设备,再在老办公地点的楼层上把业务地址改为预留的地址。不过这个事情,也就不在何书明他们的任务范围之内了。

整个机房搬迁连同前期演练和搬迁实施的过程,加上后期的值守,一共历时7天,但是整个网络的中断时间加起来也就只有5分钟,还是在搬迁1号机的时候,因为流量切换路由重新收敛造成的,所以这次机房搬迁工作对故障的规避而言堪称完美。

04

总结

本文为大家说了一次无中断机房搬迁案例,这就是一次很漂亮的故障规避案例。其中所有的预留资源和临时设备的应用都使用得恰到好处。但是这次成功的机房搬迁,出了甲乙双方配合良好,方案切实可行以外,也有一个很主要的关键点,那就是提前做好了租用专线的测试,这样在两边机房进行联动的时候,也有了一个稳定的通道。这样做,也就使得在第一天搬迁的之后,过渡环境能够稳定的撑过一天。

本章问题:

在本案例中,机房已经搬迁完毕了,但是老的办公地点要降级为一个同城网点并接入到新办公地点的同城汇聚下。这个结构是这样的:

如果原楼层交换机不想修改OSPF的区域,会出现什么问题?又该如何修改?请在留言里简单说明一下。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-04-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 网络工程师笔记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档