企业云存储与迁移概述

大数据观察

了解大数据,关注大数据观察吧!

每个想了解最新大数据资讯的人,都关注了我

文 / 数据君

当前世界形势千变万化,各种技术创新层出不穷,新兴业务模式也是波谲云诡,企业的信息化建设如何紧跟业务,适应业务乃至驱动业务转型是各级管理者的头等题目。

对于底层执行者,如何能够快速满足企业的要求,如何紧跟当前业界技术发展趋势,对其也提出了明确且紧张的学习要点。

对于企业业务发展所适配技术而言,根据时间发展,技术更新络绎不绝,涌现了多种经典组合。

早期是单台设备(PC Server)加上操作系统(Linux、Windows等)直接运行,没有什么高可用的概念,数据直接存放到服务器磁盘上,数据保护方式和技术更是简陋。

在企业发展中期,技术便涌现了许多选择,更因为单台硬件设备能容纳的资源越来越多(最恰当得解释便是摩尔定律),出现了各种虚拟化技术,包括UNIX虚拟化技术,例如PowerVM、vPar等,非常好用;

基于Linux的虚拟化技术KVM、XEN、ESXI等;基于Windows的虚拟化技术Hyper-v等,存储更是诞生了各种集中存储技术(IBM DS、EMC VMAX、HP EVA等),这些技术为企业业务的发展保驾护航,无后顾之忧。

后期,企业业务发展不甚明了,各种成本的投入产出比(ROI)要求更加严格,此时,急切需要“物美价廉”的技术为发展“添砖加瓦”。

基于IAAS的云计算产品组合OpenStack+Ceph,基于PAAS的云计算产品组合Docker+Kubernetes+Ceph(Glusterfs等)都构成了某些层级的事实性标准,这些组合为业务发展循环不断贡献力量。

从技术角度分类,其中包含两个方面,计算和存储,计算是解决运行时的问题,把业务形式进行串联,使其运转更加高效。

存储是解决状态保持的问题,需把业务语言翻译成计算机语言,然后进行加工并保存,分析使其产生巨大价值,甚者更是可以驱动业务。

如今的企业比以往任何时候都能访问更多的数据。这些数据正在以惊人的速度增长,无论是数量还是变化量。无论是传统的分析还是机器学习和人工智能等前沿技术,将这些信息从所有信息源集中到云存储库对业务至关重要。

为什么进行迁移?

企业将数据迁移到云端就像人们搬到新家一样。企业需要知道自己为什么要迁移,需要迁移什么,以及计划迁移的去向。

企业希望从云端获得什么?当前的设置是否已超出上限?如何更好地为企业的数据分析或机器学习堆栈提供动力?

企业如何利用云端提供的所有功能?是否能够利用其架构优势?其可扩展性和弹性是什么?其安全性如何?是否节约成本?将会带来什么?是一切吗?

如果对此进行一次详细调查,人们可能会对来自这么多来源的数据感到惊讶。

当然,这样复杂的举动并不是企业一时兴起的行为。相反,它需要重要的计划和正确的工具集才能取得成功。在企业构建迁移清单之前,首先考虑一些常见的注意事项:

1.安全性

在数据隐私正成为一个良好数据管理实践的世界中,了解哪些数据是可共享的,哪些数据是不可共享的,这一点很重要。个人用户需要确保其PII(个人身份信息)数据不会暴露给错误的各方是至关重要的。因此,重要的是要全面检查整个管道和数据库功能,以确保运动和静止数据的安全。了解数据如何分阶段,哪些系统可以访问它,以及保留多长时间对于充分了解信息的暴露程度至关重要。

此外,与传统的本地解决方案一样,应该考虑应用程序如何保护对象和数据。例如,是否存在基于角色的访问控制(RBAC)以及是否能够以适当的粒度(行或列级别)保护数据是重要的事项。解除数据标识和屏蔽数据是否是进入云平台的先决条件?并且授权用户管理是企业操作的关键因素吗?

最后,必须知道资产清单中的哪些数据对象需要进行特殊处理才能达到监管或合同目的。在开始迁移和规划过程时,确保平台和应用程序能够支持企业这些需求至关重要。

2.性能

迁移到云平台时,让数据可用且尽可能保持最新状态是至关重要的。数据分析可以提供业务优势,并且依赖于数据。通常,本地解决方案经过精心人工制作和专门设计,以满足业务的用户体验要求和服务等级协议(SLA)。在迁移到云平台时,无论企业使用何种方法,在特定生产工作负载下完全审查和测试管道和数据库的性能至关重要。这是理解性能瓶颈会发生什么,在哪里发生,以及如何解决它们的唯一方法。

为连续测试和监控建立特定基准和候选工作负载无疑是最佳实践。这可以使用云监控服务和查询来完成,这些查询不断轮询并验证平台是否以最佳方式运行。

3.容量

管理当前和未来的容量是本地解决方案领域的一门科学。它与维护平台消费者体验到的一致的性能水平密切相关。迁移到云平台的主要方法之一就是随着工作负载和容量需求的变化,实现弹性和自动扩展带来的优势。

在考虑未来的云计算架构时,至关重要的是,响应峰值需求场景所需的工程设计必须预先构建到平台的功能中。企业需要了解其峰值需求,并确保云平台能够处理它们。确保可以持续测试和监控这些高峰需求情景也很关键。

利用云平台原生的监控和报告服务。让企业DevOps团队了解这些技术,并预先构建这种能力,而不是在迁移之后再进行考虑。

4.资产和库存普查

在执行云端迁移策略之前,企业必须捕获所有数据资产的完整清单,其依赖关系以及上游和下游应用程序支持这些资产的内容。创建和维护此清单是迁移阶段所有计划活动的基础。如果没有这个清单,则无法完全了解将堆栈中的每个组件迁移到云端所带来的影响、风险和成本。

此外,通过此库存和评估练习,企业经常会发现重构和淘汰冗余数据源和服务的机会。这可以帮助企业避免在有限或没有未来价值的项目上浪费资源。企业还可以发现要迁移的新数据源。

主题 |云迁移

插图 | 网络来源

作 者 介 绍

数据君:)

了解大数据,关注大数据观察

部分图文来自网络,侵权则删

我想给你一个理由 继续面对这操蛋的生活

  • 发表于:
  • 原文链接:https://kuaibao.qq.com/s/20190214B0Y8XO00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券