前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【案例】谁说搬机房就一定要断网的?(一)

【案例】谁说搬机房就一定要断网的?(一)

作者头像
网络工程师笔记
发布2021-05-17 15:00:07
1.1K0
发布2021-05-17 15:00:07
举报
文章被收录于专栏:网络工程师笔记

关注我们

摘要 /Abstract/

机房搬迁,肯定是要把机房里面运行的所有设备,包括交换路由、防火墙、服务器这些从老的机房下架,再把它们安装的新的机房里面。在设备搬运途中,设备肯定是要断电的。但如果有工程师对客户说,在搬机房的过程中能做到网络不中断,你信不信?

本案例就说一次二级中心机构的机房搬迁案例,在机房搬迁的时候,做到了整个网络业务未发生中断,新办公楼和老办公楼依然正常办公。那么,这个是如何做到的呢?本文就为读者来揭秘一下。这篇文章图示较多,配置较少,主要是学习风险规避的方式。

本文核心知识点:

1、不中断网络搬迁机房的方案设计;

01

三家单位竞争一个机房搬迁项目

1.1、

机房搬迁的事情

要说网络三组这一次项目,可真的算是劳民伤财了,跑到四川的甘孜州,把每个县都实施了一圈才回来。当时梁国武就想着去一趟甘孜州,花了一个月的时间把17个县都“周游”了一圈回来,觉得自己就像环游了一圈世界一样。不过他还没来得及回一趟贵阳,四川那边又来事情了。何书明早就给他打电话说是杨万青他们在巴中的二级分支机构要搬机房,但是也没想到,梁国武才从甘孜州回来不到两天又要出差了。

作为网络三组的老客户,梁国武知道杨万青他们单位,从上到下做事都很认真,但是这种认真换一种说法就是“磨叽”。因为这次机房搬迁,总共就要花掉4天的时间,而且这还是方案里面规划的时间,按照客户的一贯风格,没有一周的时间也无法完成这次机房搬迁的后续工作。因为网络三组近期的项目安排特别多,人手比较紧张,目前最适合去巴中的就是梁国武了……那没办法,去呗。

实际上,梁国武不知道的是,这次巴中的机房搬迁实际上是一个单独的项目,专门经过现场招投标的,最后还是嘉铭科技得以中标了。所以,花7天的时间就得到那么十几万,只是花点出差补助,其他材料都是甲方供应,所以利润还是很高的。

先看一下巴中那边的网络结构,再看一下嘉铭科技是用了什么方案得以中标的呢?巴中那边一共是两张网做了物理隔离,一个是生产网,一个是办公网,两张网的网络结构一样,只是设备型号有一些差别。

通过上面的图可以看到:不管是生产网还是办公网,核心与各个无防火墙的区域(二级骨干接入、同城网点接入、办公区)之间都是跑的三层,并且使用OSPF交互路由。核心与同城汇聚之间是Area 0(为了适应同城网点的汇聚设备跑多区域OSPF的需要),二级骨干接入是Area 1,核心与楼层接入是每一个楼层一个Area。

有防火墙的区域,分别是OA服务器区和外联区。OA服务器区里面就只有两台本地的OA服务器,并且是用一台防火墙和一台网关交换机形成单机+冷备机的状态。外联区的防火墙虽然做了双机,但是对外也是只有一台路由器在连接。

因为所有的服务器都在省公司集中管理,所以在机房搬迁的过程中,倒是那几个无防火墙、有OSPF的区域要求网络尽量减少中断时间。所以后来杨万青才考虑,使用公开招标的方式,让为他们单位服务的三家服务商出方案。

1.2、

机房搬迁的方案

机房搬迁的具体要求如下:

A、对于实时性要求高的生产网,要求在搬迁的时候累计中断时间不能超过20分钟;对于办公网,累计中断时间不能超过1个小时。

B、甲方可以提供功能良好的临时交换机若干,并且提前在新办公地点联系好ISP,准备好租用的链路,原则是:上联对二级骨干网两条,下联对同城网点两条,外联一条,新办公地点和老办公地点之间一条。

C、局域网内的IP地址规划尽可能利旧,如果必要,生产网预留11.89.226.0/24,办公网预留10.120.226.0/24作为临时过渡地址使用。

第一家公司,做局域网接入层运维的就觉得:这个机房搬迁纯属说笑。因为巴中城市虽然不算大,但是新办公点和老办公点分别位于城市的东边和西边,直线距离都有5Km,光是开车都要20分钟了,还不算设备断电、下架、搬运、安装的时间。所以他们直接就放弃了提供方案的想法。

第二家单位的倒是想到了一个办法。那就是先用临时交换机在老办公点,先按照和现网一样的结构搭一个临时环境,正好可以用上这些临时交换机和预留的地址。然后把现网环境中的设备下架,搬运,然后通电以后再拆除临时环境。不过这种方式也被杨万青他们给毙了。因为搭临时环境,且不说临时交换机都是1U的低端设备,能不能撑住那么大的流量,就算是搭临时环境也需要一天的时间吧,而且中间那个线缆还需要来回迁移,操作性也不强。

而嘉铭科技给的方案是这样的:

既然是要做到不断网搬迁机房,而这些无防火墙,有OSPF的区域都是双机互联,而且同城汇聚还是一个温备在运行。那就可以先搬走一半的设备到新办公地点,留下一半的设备在老办公地点。也就是,先把2号机搬走,留下老办公地点只有1号机在工作。

待到2号机到达新办公地点并上架以后,利用租用的新、老办公地点的专线,把让新、老办公地点的核心和上联RTP设备先互联起来,形成如下图所示的一个过渡环境(以生产网为例):

在核心-2、上联RTP-2、同城温备和OA冷备搬移到新办公地点的机房以后,立即开机,使其和还在老办公楼的核心-1、上联-1进行联动。

此时,就可以考虑先启动OA冷备防火墙和交换机,让冷备机成为在线机,同时关闭位于老办公地点的OA在线机。这样,OA服务器就可以实现无中断迁移了。对于同城接入也可以用类似的操作,把同城汇聚在线机的对同城单位的配置,平移复制到温备机上,再把对同城站点的MSTP链路转移到温备机上,并断开同城汇聚在线机的MSTP链路,这样,同城汇聚的业务也被无缝衔接过来了,只要不出链路质量的问题,这个路由收敛过程也就是几分钟。

过渡第二阶段的结构和相关操作如下图所示:

而外联区域怎么办呢?

首先,生产网和办公网对外联区域的实时性要求都不高,只要在天窗时间到来之前开机即可,所以外联单位可以考虑随着所有的1号机一起搬迁。

楼层接入怎么办呢?

还有一个重要的区域就是楼层接入。生产网的楼层接入终端比较少,基本上一个楼层也就那么2—3台智能终端。所以,生产网可以不用预留的地址,直接把多余出来的地址做一个整合做重规划。因为生产网的1—3楼分别使用的地址是11.89.225.0/25、10.89.225.128/25、10.89.226.0/25,重新规划后,1—3楼分别使用的地址是11.89.225.0/26、10.89.225.64/26、10.89.225.128/64。终端数量少,所以也方便重新修改IP地址。

先提前让省公司的运维人员做好相关防火墙的策略调整即可。智能终端可以在搬2号机的时候先搬过去。

而对于办公网的楼层接入呢,何书明建议杨万青弄几个库存的新设备过去。老办公地点的楼层接入就拆下来当备机使用了。考虑到办公网的终端比较多,预留的地址不一定够用,所以,办公网的楼层接入就采用下面的步骤来做了。

1、提前在新办公地点把新楼的办公网楼层接入上架好,从老楼那边的办公网楼层设备上把配置平移复制过来,暂不连线。

2、搬迁1楼的时候,就把老办公地点1楼的楼层交换机与核心-1断开,再把新办公地点1楼的楼层与核心2连接,搬迁2楼、3楼也按照这个步骤进行。

3、办公网的楼层搬迁完毕以后,再搬迁办公网的所有1号机。

整个过程可以见下面的图示:

搬迁完毕后,老办公地点降级为一个同城网站,利用新、老办公地点之间的租用链路,老办公地点使用一台上联设备与新办公地点的下联同城汇聚互联。对于留守老办公地点的人员及终端,就可以启用预留地址11.89.226.0/24和10.120.226.0/24了。

这个搬迁过程可以规划为7天。

第一天和第二天可以用于演练,第三天搬迁所有的2号机和冷备,第四天搬迁所有的1号机,终端机可以视情况选择在第三天或第四条搬迁。最后三天可以用于搬迁后的值守、测试,还有完成一些可能存在的后续工作。

02

搬迁之前的演练

因为机房搬迁,涉及到一半的网络断电,下线和上线的过程,在这个过程中,所有的路由都要收敛一次,主备也都要切换一次,所以必须进行一次演练。演练的方式当然不能断电,而是使用关闭接口的方式进行操作。

2.1、

演练的方式

搬迁演练,就是先关闭所有2号机的接口,断开2号机上的业务,检查只有1号机单跑的时候业务是否能正常。然后再打开2号机的接口,路由收敛,网络稳定以后再关闭1号机的接口,检查只有2号机单跑的时候业务能否正常(此时模拟的是正在搬移1号机时的网络状态)。最后,再把所有的1号机全部开起来,OA、同城汇聚的冷热切换做一次,就完成了模拟演练。

以办公网为例,看一下演练时需要做的操作:

演练第一步:关闭核心-2上与2号机上的接口,最后再关闭核心2与核心1之间的接口。

演练第二步:切换OA、同城站点汇聚的冷热机,再开启核心-2上的所有接口

演练第三步:逐步开启核心-2的接口,待网络稳定后关闭核心-1的接口。

2.2、

核心上的关键配置

先看一下生产网核心上的接口配置和路由相关的配置

核心-2上,重分发静态路由加大Cost,并加大OSPF的参考带宽,这样就可以使得网络业务的流量优先走核心-1转发。

办公网核心(华为S7706)上的关键配置

好在生产网和办公网上的VLAN ID没有重叠的,这也为后续搬迁实施的时候提供了一定的便利。

从关键的核心配置来看,实际上可以证实到,不管是生产网还是办公网,流量都是主要走核心-1。而且,在整个网络中,生产网和办公网内没有VLAN ID重叠的现象,所以在实施机房搬迁的时候,新、老办公地点的临时交换机就可以同时为生产网和办公网做桥连接了。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-04-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 网络工程师笔记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档