Oath如何迁移到OpenStack?

导读

当你为互联网巨头Oath(原雅虎和AOL)工作时,你想做什么?你想更新他们的基础设施? 将超大规模企业数据中心从传统的定制系统迁移到 OpenStack 看起来是一项非常艰巨的任务。詹姆斯·潘尼克(James Penick)做到了。他的团队使用 OpenStack 软件管理数十万计算资源——这涉及 Oath 70%的基础设施。潘尼克在澳大利亚悉尼举行的OpenStack峰会上谈到了迁移策略。

把如此庞大的基础设施迁移到 OpenStack 并不是一蹴而就的。对一个巨型的互联网公司来说,管理公司的基础设施所需的工具并不齐全。这导致了大量的手工劳动,还涉及到谁负责 。“我开玩笑说,这是人即服务。”潘尼克说。

这种IT环境也导致 ——如果建立了特定的资源(硬件或软件),人们往往会紧紧握住,而且在离开时带走它们。

Oath最初的基础设施由每个数据中心的数十个二层背板构成,将整个系统分成许多小型计算池。潘尼克说:“这使得转换到云变得非常困难。”

当然,潘尼克首先要做的就是让大家信服 OpenStack 是正确的解决方案。 他说,需要对决策者诚实,告诉他们平台能做什么,不能做什么。 “当你试图影响他们转向这个新事物,诚实直接地与他们打交道更有用。”

另外,你需要能够解决公司的根本需求,而不要试图解决所有问题。潘尼克说:“不成熟的优化意味着好软件的死亡,专注于主要的。”

使用 OpenStack 技术构建私有云基础设施的第一步是了解项目建设的来龙去脉。 彭尼克说,他的目的是让人们轻松地完成工作,并使公司更灵活地实现业务目标。他说:“所有这些都归结为想赚钱和省钱。” 关注这些基本原则也可以帮助团队决策。

下一步是找到愿意试用新基础设施的客户。问这些客户想要什么( 他们要求的一些事情是合理的,一些不是)。与现有的内部工具集成是一个很好的合理请求,而拥有根访问权限的专用虚拟机管理程序则不是。 “挑选重要的东西很重要。”潘尼克说, “对于不切实际的用例,要坚持自己的立场。你是在为组织提供一个资源池,而不是为一个特定团队。”

现在,你可以准备一个集群,让试点客户用,让他们使用计算资源。潘尼克说:“如果你的试点客户在一个生产型的安全区域,那很好。确保你可以和客户合作,获得数据,了解他们如何使用它,然后向其他用户宣传推广。”

你可能会看到一些具有挑战性的用户行为,请准备好。 “你会给他们配额,建立新的集群。但很快客户就用完了,因为他们热衷于建立尽可能多的虚拟机以确保预留所有计算资源。”这么做能衡量正在发生的事情,会帮助记录成功。

接下来,你需要继续前进,创建更多集群,构建基础设施并添加更多用户。你会专注于做什么。 “不要试图说会省下好多钱,会运行大规模的overcommit。也不要急于展示可以节省多少钱。“潘尼克说, “说服、鼓励人们使用基础设施即服务,这是在迁移一家大公司上云时需要解决的重大问题之一。因为你正试图让人们认识到, 可以用API来做他们的日常工作,而且更好更快。省钱是随之而来的结果。”

潘尼克能够在世界各地的五个集群上获得更多用户,他们称之为Openhouse。他说:“公司的每个人都可以在这个环境下启动五台虚拟机。这使他们能够即时建立开发环境。随之而来的是,我们实际上已经成功‘杀死’了Windows笔记本电脑和台式机。”这样的实施有效地节省了硬件上的大量资金,让员工的生活变得更好。

现在,公司中的人员正在使用虚拟机来处理他们的沙盒环境。他们在做研发、创新,看到一些敏捷性。然而,该公司仍然专注于裸机。 潘尼克告诉他们,他的团队将支持Bare Metal,但只能与公司用于获取Bare Metal的现有流程相集成。他说:“花费大约三十到九十天的时间才能获得物理计算资源,所以我们会进入这个领域。这意味着,你必须坐下来,与供应链团队、属性架构师、和应用架构师密切合作,以影响他们,并说服他们使用这个东西。”无论如何,在用户和基础设施之间需要有一个OpenStack API。

最终,让人信服的是潘尼克的 OverStack 实现让使用 Bare Metal 更加容易。“如果你需要请求计算资源,我们要做的就是采用十个最常用的硬件配置,并把这些配置放到你在的网络背板上。 我们会建立一个大型的硬件池,让你可以到一个论坛说:'嘿,我想要五个这样的东西。' 批准、完成。你就可以走了。”

彭尼克说,这就为人们提供了一条简单易行的途径,鼓励人们采取正确的行为。80%到90%的单个硬件请求现在都是通过一个带有几个简单问题的软件工具来完成的。 “我们提供四十六到六十个问题,其中大部分可能会折磨你。”彭尼克开玩笑说, “所以我们减少到:你是谁,想要什么,你想在哪里要,你想要多少?”

新工具向请求者显示每种类型的配置可用的数量。潘尼克说:“公开和诚实。我们都是同一家公司的一部分。我们相互信任。给人们足够的信息,使他们能够作出明智的决定。”

使用OpenStack基础设施最后成为了必须。彭尼克说:“我们确实有足够的动力去鼓励人们做正确的事情。”

最后,潘尼克和他的团队使用现有的硬件,并使用OpenStack进行管理。 他称之为“水平迁移”,所有硬件都可以通过OpenStack系统删除或重新镜像。Oath现在70%在OpenStack上,剩下的30%将在2018年年底迁移大部分。

潘尼克和他的团队花费了五年的时间来实现这个超大规模的迁移。现在,即使是最初反对OpenStack的核心人物,在规划新项目时也会自动想到Openstack。“如果我们再做一遍,可能只需要两年。OpenStack有了很多增强功能,而且业界已经发生了很多变化。”

“但请注意,”潘尼克总结说,“六个月内你没法完成这个任务。在做的过程中,要对于你能够完成的事情有一个现实的期望。”

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171225B02L5D00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券