混合云IT架构时代,企业如何利用AI应对数据挑战?

9 月 8 日,IBM “科技一席谈” 媒体专访在线上举行。IBM 大中华区科技事业部、客户成功管理部总经理朱辉,IBM 中国混合云与 AI 华东及华南大区总经理许伟杰分别就“数据与 AI”主题做分享,并与 InfoQ 在内的众多科技媒体一同交流。

混合云 + AI 已成 IBM 战略核心

当前,混合云 + AI 已成为 IBM 当之无愧的战略核心。

IBM 大中华区科技事业部、客户成功管理部总经理 朱辉

朱辉透露,目前 IBM 三分之一的营收来自于混合云相关业务,公司硬件、软件、服务、咨询等各条线都已经统一到了混合云与 AI 的战略平台上。此外,从软件的角度来看,经过过去五六年的调整和整合,整个软件的产品线都已经集中到了基于容器化平台的 Cloud Paks当中。

“Cloud Paks 相当于把 IBM 广受客户认可、技术能力非常领先的企业级软件基于红帽 OpenShift 进行容器化、以微服务的方式来提供给客户。不仅是把这些工具给容器化,还有很多基于容器的协同、管理的能力。”许伟杰说道。

IBM 中国混合云与 AI 华东及华南大区总经理许伟杰

而在市场销售的售前、售后服务体系方面,IBM 也已经建立了以数字化转型、混合云与 AI 能力为主的咨询服务体系,通过车库创新、设计思维工作坊(Design Workshop)的方式和客户共同创新,帮助客户运用最新的技术,在完成数字化转型、产生新的业务创新和业务价值的过程中,来发现、定义新的业务场景和 MVP(最小可行性产品)。

数据方面,目前全球有 3200 多个企业级客户使用 IBM 的混合云平台,有 4 万用户使用 IBM 的人工智能技术。IBM 今年二季度的财报数据显示,IBM 在过去 12 个月的总营收当中有三分之一是来自于混合云相关的业务,金额大约为 270 亿美金(约为 1738 亿元人民币)。

混合云 IT 架构时代,企业正面临数据挑战

新技术能帮助企业提高生产力,创造新的价值。但与此同时,企业也会面对相应的挑战。具体来说,有以下三方面挑战:

  • 第一,企业如何尽快、简单、低风险、低成本地搭建起混合云的环境和基础架构。把公有云、私有云上面部署的应用和拥有的数据,以及本地系统当中运行的应用,在一个混合的 IT 环境下进行监管、运营、运维。
  • 第二,智能自动化,怎样通过技术和人工智能的能力,把低端、低价值的工作自动化。
  • 第三,怎样通过人工智能来实现数据的价值。

其中,利用 AI 来实现数据价值的诉求还远远没有达到理想状态。IDC 数据显示,有高达 90% 有价值的企业数据,或是无从访问,或是无法信任,或是未被分析利用。这既阻碍了企业的决策,也限制了企业对业务表现实现实时的可视化、对客户作出更快响应的能力。

在朱辉看来,虽然当前很多企业已采用混合云,并使用了大量 AI 技术,但同时也面临诸多技术问题:

  • 第一,数据量急剧增加,随着非结构化数据加入到整个企业级数据的来源当中且成为越来越重要的来源之后,一个企业所拥有的数据量以及增长速度正在呈几何级增长。
  • 第二,数据不仅来自于不同的应用系统,还存在于不同的形态当中,包括公有云、私有云和本地应用上。这些数据如果按照原来数据仓库、数据集市、统一数据平台的概念,把它复制或移动过来,会导致成本和复杂度越来越高、可靠性越来越低、所需要的时间越来越多。这意味着,难度也随之越来越高。

对企业而言,如何利用 AI 技术来应对繁杂艰巨的数据挑战,是值得持续探索的课题。

利用 AI 解锁数据价值

为了解决企业在混合云 IT 架构时代如何发挥数据价值的问题,Data Fabric 数据架构理念应运而生。

Data Fabric 是一种架构模式,目的是在混合云时代解决企业内部数据资产多样化、分散化、规模化和复杂化等挑战。Data Fabric 以智能、安全和自服务的方式,动态地协调分布式的数据源,跨数据平台提供可信赖的数据,从而支持各种分析及应用场景。Data Fabric 不是点对点的连接或单⼀枢纽式的数据集成,⽽是在混合数据源之间“跨越”⼀个虚拟⽹络,使得数据在这个虚拟的网上迅速流动。 

简单来说,智能化的 Data Fabric 的主要功能就是,在正确的时间,从任意正确的位置,将正确的数据与正确的人连接起来,从而全面释放数据价值,加速企业的数字化转型。

IBM Cloud Pak for Data 的模块化和可定制性质提供了一种理想的环境,可通过针对用户的独特需求量身定制的解决方案构建 Data Fabric。

具体来说,IBM Cloud Pak for Data 上的智能化 Data Fabric 可以提供以下四方面 AI 自动化能力:

1.AutoCatalog(自动分类)

AutoCatalog 相当于一个由 AI 赋能的“大脑”,可以对数据的发现和分类流程实现自动化,建立自动化目录,维护来自于不同数据环境数据资产的 Dynamic(动态的)的 Real time catalogue(实时目录)。实时目录能够提供能力上的支撑,是一个非常重要的自动化的能力,可以轻松查找跨企业内不同业务团队之间的数据。

2.AutoAI(自动建模)

AutoAI 主要用来尽量降低 AI 模型开发、模型校正、模型自我重新培训的技术门槛和人力付出,从而对动态的数据和整个 AI 本身算法生命的周期进行自动化。

3.AutoPrivacy(自动识别隐私规则)

AutoPrivacy 主要是通过数据隐私框架当中的关键能力,使用 AI 的能力智能化地识别企业内部的敏感数据,当被调用的时候系统能够识别到、监控到,甚至在后续当定义敏感数据的使用和保护时,就可以为企业内部的政策实施自动化提供技术和智能化的保障。

4.AutoSQL(自动查询)

通过 AutoSQL 的技术来实现访问数据的自动化,无需物理地移动这些数据,从而提高了数据查询的速度,也降低了使用数据的人对数据来源所需要的了解。

IBM 将上述四项 AI 赋能的自动化能力都加入到最新的 Cloud Pak for Data 4.0 版本当中。从目前实验室内部做的一些比对来看,Data Fabric 的价格以及自动化能力,能够把查询的速度提高 8 倍以上,成本降低大概一半。

在朱辉看来,Data Fabric 是非常重要的技术栈演进。随着数据不断增长,企业数字化进程必然加快。在此背景下,如果没有人工智能,仅依靠人力来解锁数据价值的成本巨大。

“混合云架构实现了数据的民主,让数据变得更加公开,更加能够被普适性应用。在不伤及数据的拥有权、敏感度、安全性、可信性的前提下,让更多人能够从数据当中获益,享受数据带来的价值,实现数据的民主化。我们整个理念、技术的演进,就是围绕着这样的一种思路和逻辑在往前推进。”

写在最后

当前,AI 在诸多领域已具备决策能力,比如 AlphaGo 走的每一步棋都是一个决定。至于 AI 做的决定是否可靠,朱辉认为这其中只有一小部分是技术问题,大部分实际上是人文问题、法律问题和社会问题。

对于未来,朱辉认为 AI 能做的决定一定会越来越多。“但最终用 AI 做多少决定,还是人类的选择。”

  • 发表于:
  • 本文为 InfoQ 中文站特供稿件
  • 首发地址https://www.infoq.cn/article/a2mgeTH7owuGPI6KwbKE
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券