数据中心如何“复制黏贴,无缝迁移”

前言:

企业在发展的过程中由于某些原因,大多数企业在其IT环境的生命周期中可能需要考虑数据中心迁移问题,那么数据中心如何无缝迁移?IT经理和管理人员期望在保持安全环境和提高成本效益的同时,提高效率,实现高可用性,并保持竞争力。无论数据中心迁移的原因是什么,这都是一项复杂的工作,必须尽可能无缝地实施,以最大限度地减少对企业的干扰。

无缝迁移数据中心有几种原因:一是企业预算不足,需要消减人力成本、电力和冷却成本;二是企业可能缺乏数据中心运营所需的空间。三是因为企业需要满足特定的监管和合规要求。此外,数据中心冗余和网络互联的需求也是企业在衡量是否迁移数据中心时必须考虑的其他重要因素。

数据中心迁移是一个工程庞大而艰巨的项目,并不是个轻松的任务,但是却是企业必须面临的问题,因为数据中心需要进行合并、转移、整合、构建以及其他更新。毫无疑问,这样一项任务会很快成为数据中心管理员的新挑战,特别是当需要进行地面布局和有其他物理需求时。

除了一部分很明确的规划,如设置机器的修养期、安排旧设备淘汰和进行服务器整合,管理员也必须考虑应用软件的停工期。幸运的是,由于可进行数据中心托管并且硬件价格低廉,因此彻底停止数据中心的服务在当前是可以避免的。

然而,应用软件托管需要充分的预先计划,任何阶段和产品需求都不能出差错。尽管当前将核心系统转换到外部环境的情况已大大减少,有时管理员还是不得不咬紧牙关选择托管的方式以确保应用软件的持续运行。

恰当的计划是使服务和设备转换平稳进行的关键,只有这样才能使用户的工作不受到任何影响。最终管理员结束这一艰巨的任务,这需要不同IT小组(包括工程师和技师)之间良好的沟通,可以使这一重新部署任务圆满完成。

硬件迁移:迁移服务器硬件,一般采取两种方案:平移或数据复制。

(1)所谓平移

就是把服务器硬件放到车上然后运送到新数据中心并安装,但这种方法最大的风险是:在搬迁的过程中服务器被损坏,或者两个数据中心相隔太远,无法保证服务在可以接受的时间内可用。

(2)所谓数据复制

就是通过一条租用的线路进行数据迁移。这里有两种方案:从物理机到物理机(P2P)的迁移,或者从物理机到虚拟机(P2V)的迁移。

P2P迁移需要购置同类硬件,以便原有数据中心的应用程序和硬件可以迁移过去,同时确保停机时间最短。

P2V需要通过租用线路,将物理机转换成虚拟机,并且能确保硬件成本是最低的。

数据中心无缝迁移实施步骤:

首先得知道需要迁移什么:你可能购买了新设备,想要将其中一些项目或者全盘挪到新的地点去。以旧换新逐步淘汰旧设备的时刻非常关键。因为设备迁移是有风险的,如果有什么东西在途中损坏,就可能导致系统在新地点无法运行。外来设备或迁移期间的服务合同可以使迁移过程更加顺利。一旦你知道哪些设备是需要移动的,就需要决定是一次性移动所有设备还是分批转移。

然后列出设备清单:标注需要保留和正在运行设备。如果一台设备需要移动,查找记录保修信息和序列号,确保迁移过程不会导致保修失效。

再来集结人员完成迁移:将人员分为领导、搬运工和准备随时监测并迁移系统的技术团队。制作一个搬运当天的全面计划,内容包括搬运方式、搬运项目、备份计划、安装以及测试方案。想想每一个步骤可能涉及到的风险,并尽可能减少迁移对公司业务的影响。

最后文档编制和测试:安装好一切后,开始测试,对照盘存清单检查新设施中的设备,以防任何错位。核对系统和应用程序列表,确保它们都运行正常或更换到位。为了将来的文档编制完成项目审计审查,评估迁移成功。

迁移细节:

(1)将设备、电工和IT员工相协调:从一开始,我们就很明确地告诉每个小组我们需要转移基础设施设备和机架的最小量。迁入的新服务器机房比以前小,因此我们面临着潜在的所需机架和架子的空间安排问题。我们计算出所需机架和架子的最小量——既可满足需要,又可放入新机房内。

(2)评估平台稳定性:要注意设备的工作寿命,在运输中是否会有故障的风险?企业需要确保数据中心设备在紧急情况下处于待命状态。

(3)了解网络配置:企业在新的位置建设部署其新的网络,并彻底测试通信情况。而不能简单地依赖于网络基础设施的复制配置。

(4)定义关键数据:识别每个数据资产,以及意识到其对企业的重要性。确定数据资产的使用方式及其与整个环境的关系。

(5)确定迁移造成的停机时间:了解在整个数据中心迁移过程中将会产生多少停机时间。这个持续时间将影响处理实际迁移的方法。

(6)停机但是保证数据中心持续运行:在转移的当天我们提出一个普通但是很却很有效的行动计划。员工在转移设备和部件时不断开关键的网络通路。

(7)定义数据中心迁移计划:企业需要建立迁移方法以确保没有遗漏。在数据中心的搬运过程中,设备是否需要上下搬动或移动?在整个迁移过程中需要正常运行时间吗?需要评估数据迁移所需的工具。如果企业正在使用云迁移策略,请确定要传输的数据量。一些客户选择网络存储设备,它们将首先迁移数据副本,而其他客户则使用能够进行数据传输的软件。评估最佳方法是由数据和正常运行时间要求的重要性来驱动的。请记住,也可以使用这些方法的组合。

(8)冷却系统和其他系统:此处有一个被忽略的内容。由于设计原因,CMP Channel Test Center新服务器机房需要更少的冷却设施,但是数据中心总的工作量却没发生变化。我们需要仔细观察并进行测量。转移一个数据中心时,你也需要与电工讨论相关问题,例如新机房可获得的最大电力负荷,以确保未来的机器数目增长可与之相适应,同时也使CIO和CEO们了解机房的电力承载力。

(9)维持数据中心运行:数据迁移和保证核心应用软件运行从来不是什么大问题。然而,根据我们的经验,成本最少的行动方案是将工作分解。换句话说,在迁移期间实际存在两个数据中心。维护小型数据中心的VAR应该推荐采用这一方式以保证数据中心的持续运行。这可实现在迁移过程中不需要进行基础设施托管。

(10)开始运行:不在万不得已的情况下,不要断开机架和网络的线路连接。断开的连接越少,花费越少,同时一个客户机可以更加迅速地恢复运行。为了加快CMP Channel Test Center的迁移速度,员工尽量保证线路连接,同时在断开的网络连接上贴上标签。结果显示我们节约了大量时间。

(11)测试数据中心迁移计划:通过应用程序完成一系列测试,以验证企业布置的每个步骤是否能正常工作进行。测试将更好地了解如何逐步完成该过程。

(12)注意机器启动的顺序:数据中心迁移之后重新开通运营时,机器启动的顺序至关重要。如果企业在某些应用程序之前启动其他应用程序,则可能会对业务造成严重的性能问题并影响运营。

(13)沟通和期望:沟通和期望在各种业务功能上的清晰度很重要。企业的管理人员需要调配工作人员和花费时间来验证其移动对方的服务器。他们还需要了解如何帮助他们更好,更快,更有效地完成工作。这就是为什么企业应该确保所有的业务部门知道发生了什么,何时发生,以及为什么发生的原因。企业花费一定时间来交流其的计划,并设定期望值。

(14)考虑与专业人士合作:仔细考虑企业的团队是否有足够的内部资源来执行成功的迁移。如果企业希望自己迁移,请记住第三方仍然可以帮助数据中心实施迁移,提供工程师以帮助数据迁移。

(15)测试,测试再测试:不要对任何一个小的环节掉以轻心。检测网络连接,外部服务和服务器,和其他参与迁移的人员保持联系,并让其对任何损坏负责,对实验室的重新部署点醒了我们大家。很多工作中和设备测试中经常被忽略的小细节都显示出其重要性,需要在迁移中引起重视。

本文来自企鹅号 - 机房百科媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ThoughtWorks

线上分享 | 优质课程:DevOps从入门到精通

如今『DevOps』在许多企业里早已不是什么稀奇之物。这个由『Dev』和『Ops』共同组成的词究竟有什么特别之处?为此,来自ThoughtWorks的DevOp...

751
来自专栏about云

让你真正明白容器技术--容器技术对IT行业的影响及在游戏云应用展望

问题导读: 1.什么是容器? 2.容器是如何发展起来的? 3.容器技术有哪些优势? 4.传统游戏后台架构存在哪些问题? 5.容器对于开发人员带来哪些好处? ...

2588
来自专栏华章科技

高级运维架构师分享Linux 集群和自动化运维心得

大数据实时处理之美:参与问答活动获得实时计算书籍(活动时间:10月18日-24日)(点击“阅读原文”即可参与)

522
来自专栏飞总聊IT

Azure Datalake Store Gen2:微软放了大杀器还是做了大傻逼?

2018年6月,微软正式宣布了Azure Datalake Store Gen2,第二代数据湖文件系统。熟悉微软数据湖的知道,这个东西是Raghu搞出来的,用于...

963
来自专栏技术视点

17个混合云安全威胁及解决方案

反对者经常将混合IT云视为一种混乱的架构。但这并非混合IT云的问题,问题出在较差的网络执行、安全协议和管理上。无缝混合云的最大障碍是合规性不足、缺乏加密、风险评...

1859
来自专栏云计算D1net

采用五方案,让虚拟化更安全

存储虚拟化技术已经在市场上杀出了一片天地。当然我们还是需要不断的学习。关于存储虚拟化技术的安全性,在真实世界中唯一出现的主要供应商的脆弱性报告是微软的升级漏洞,...

3196
来自专栏云计算D1net

满足IT需求最好的云备份选项

没有什么办法来复制数据短缺,在云里仍然是这样的。当人们浏览自己的云备份选项时,要仔细看看他的云环境,包括他的云计算供应商的本地备份服务、数据库等等。 回到在虚拟...

3149
来自专栏云计算D1net

多云工作负载迁移:自动化是何作用?

为了高效地管理一个多云计环境,请同时考虑应用架构和用户部署两方面的选项。此外,自动化可有助于多云的高效管理,但它对于工作负载决策方面具有战略意义。 ? 云计算正...

2537
来自专栏数据和云

2016年度中国Oracle数据库使用现状分析报告

Oracle数据库从20世纪末就已开始在国内使用,在经历了20多年的迅猛发展后,目前已经占据了全球数据库的首位,在国内拥有数十万的技术粉丝与数万家企业用户,但到...

3329
来自专栏SAP最佳业务实践

从SAP最佳业务实践看企业管理(170)-CO-178标准成本计算

计算过程:先从底层计算,然后层层上卷到上层。 物料清单中可能会包括一些半成品,这些半成品本身也有物料清单。这样就构成了多层物料清单(MultilevelBOMs...

3128

扫码关注云+社区