AI落地,如何辅助决策者将价值最大化

人工智能算法已经出现多年,但是直到最近,人工智能的价值才开始在企业中得到快速扩展。

快速扩展的原因基于两方面:一方面处理和存储数据的成本都已大幅下降。另一方面,计算科学家已经改进了人工智能算法设计,包括神经网络在内,使得训练模型获得了更高的准确度。

人工智能系统首先学习数据,然后从中推理出结果

为了进一步加快人工智能普及速度,推动了基础设施创新,业界和学术界纷纷将与人工智能有关的功能直接嵌入到硬件之中,例如:最新的 英特尔®至强®可扩展处理器为广泛的人工智能工作负载提供可扩展的性能,在深度学习模型训练和推理中提供突破性的性能,英特尔®Nervana™ 神经网络处理器则采用专为神经网络构建的新型架构。

专业硬件的加持,使得人工智能潜力明显,但是许多企业还没有开始采用人工智能,其采用速度也比不上媒体和学术机构在报告中推测的速度。

经过媒体调查,这些企业担心广泛的潜在机遇带来的挑战。

那么,什么样的机遇能够带来最好的结果?如何确保能取得成功的结果呢?

英特尔为此提出了一套“概念验证(PoC)”的解决方案,并且详细撰写了一套“白皮书”,能够帮助决策者回答这些问题,同时最大化价值,最小化风险。

注:概念验证(POC)是一种“封闭”而有效的解决方案,从了解要求一直到实现成功,可根据明确的标准对该解决方案进行评估和测量。对于任何人工智能项目或程序,概念验证让决策者能够:更快收获价值、获取技能和经验、测试硬件、软件和服务选项、确认和解决潜在的数据瓶颈、突出人工智能对 IT 基础设施和广泛业务的影响、提升人工智能的积极印象,提高用户的信任度。

概念验证具体来说分为五个步骤。第一步确认机遇、第二步确定问题的特征并分析数据、第三步架构和部署解决方案、第四步评估商业价值、第五步纵向扩展概念验证。大数据文摘也将白皮书简要介绍如下。

第 1 步 确认机遇

请你务必从一开始就明确了解你希望利用人工智能达到哪些效果,为何它对你的企业至关重要,以及你如何确保它能够提供所需的功能,这些非常重要。如果你尚未明确能从人工智能中获得哪些益处,你应该实施评估,看看人工智能可在哪些地方产生立竿见影的效果:

  • 思考行业中的其他企业都在使用人工智能做些什么。
  • 在你的企业中,看看哪些方面存在明确需要解决的问题,或哪些方面能从人工智能中获益。
  • 在工作中利用现有的专业知识库,使用内部已有的技能和经验。

在确定了哪些方面能从人工智能获益后,可以根据几项标准来测试各个机遇。这项工作无需花费很长时间,而以下问题可以帮助你确认你的组织在规划方面的不足,以免仓促启动人工智能项目:

  • 你是否明确知道自己想要解决的问题、其对应的具体要求,以及你将如何衡量成功?你是否考虑过或曾部署其他解决方案来解决此问题,后来因为倾向于人工智能而放弃这些解决方案?
  • 是否明确限定了机遇的范围?例如,你是否能简要说明这个机遇会使用到的数据集、关键组件、将会受到影响的人员,以及其他依赖项?它是某个更大解决方案的一部分吗?
  • 你是否具备让它成为现实所需的技术资源和资金?你是否能够不受技术、合同或其他因素的阻碍,直接使用你所需的数据源?
  • 对业务的有利影响是否足以抵消所付出的努力?那些容易看到的成果非常重要,有利于提高用户对人工智能的信任度,让更多的利益相关者参与进来。
  • 推动力和获得的支持是否足够(例如高层的支持)?受到影响的业务部门是否全力参与来解决这个问题?
  • 时间安排上是否合适?是否明确指定了交付团队?这个团队是否具有足够的时间、技能和动力来完成这项工作?
  • 组织是否具备更广泛的数据科学和 / 或人工智能战略?此战略是否与其目标一致?组织目前已具备哪些数据科学基础设施和专业知识?
  • 概念验证成功完成之后,后续准备怎么做?是否有资金用于维护或扩展该解决方案?负责运营的 IT 部门是否获知了基本情况并准备好参与其中?

第 2 步 确定问题的特征并分析数据

在你确认和测试过机遇之后,接下来可将注意力转向了解和详细阐述待解决的问题,将其映射至更广泛的类别,例如推理、感知或计算机视觉。

组织遭遇的部分挑战,尤其对于尚处于人工智能早期阶段的组织而言,就是内部没有足够的技能。

在你的人工智能工作流程中,这也是思考更多可能会给解决方案带来影响的技术问题的绝佳时机。例如:

  • 你是否倾向使用某些硬件或软件?为什么(基准测试数据、TCO、首选供应商)?
  • 安全 / 监管 / 数据 / 其他方面的需求是否更倾向于选择本地系统而不是云?
  • 你的解决方案是在本地自己维护,还是部署到数据中心中?
  • 当前数据中心的利用率是多少?性能 - 功耗比有多重要?
  • 你会按照什么频率和数量为训练 / 推理提供新数据?
  • 在静态和动态情形下,如何保持原始数据和生成的洞察始终安全?

第 3 步 架构和部署解决方案

下一个问题是,如何设计和部署已通过概念验证测试的解决方案。如图 3 所示,这由一个技术栈组成,包括:

  • 基础产品和系统基础设施
  • 人工智能特定的软件,用于推动基础设施建设
  • 起支撑作用的人工智能框架,用于为计划的解决方案提供支持
  • 虚拟化技术、前端软件和 / 或硬件

在这个阶段,你可以考虑到底是构建、购买或再利用硬件和软件,还是利用云服务。

即便是按照最佳实践构建和测试的基础设施和软件,仍然需要考虑人工智能的各种要求。尤其是持续提供高质量数据这一要求。数据科学家能够与 IT 系统架构师合作设计从数据中心到边缘的部署架构,并且考虑软件集成、网络连接、硬件问题和其他各方面。可能需要测试多个选项:应该采用测试加学习的方法,以便能获取更多的经验。

完成之后,你可以处理解决方案的其他人工智能相关元素——构建模型、训练和调优。

构建模型

模型构建属于人工智能的核心任务。数据科学家参与其中,使用训练数据和管理参数来实施迭代测试。这样,在他们发送模型用于更广泛的训练和调优之前,可以检查模型的初始融合准确性。

训练和调优

训练和调优是人工智能工作流程中计算密度最高的部分。在这一阶段,数据科学家需要确定在哪些参数下,模型能够基于所提供的训练数据实现最有效的融合,同时解决作业调度和基础设施管理等常见的传统 IT 问题。

这个过程非常耗费人力,数据科学家需要花费大量时间来手动整理数据并执行数百次试验。

第 4 步 评估商业价值

作为解决方案设计的一部分,你需要定义概念验证的评估标准:对于工程师,这些标准可以转化成能够设计、衡量、持续自动测试的评估标准。

现人工智能解决方案架构可以表示为堆栈

以下这些评估标准可用于评估商业价值:

  • 准确度:解决方案提供的结果和洞察是否正确?是否可以重复?
  • 完备性:这种解决方案是否正确使用所有数据源?
  • 时效性:是否在需要时,按照需要提供洞察?
  • 除此以外,无论其运行状况是否符合预期,此解决方案还需遵循其他标准:
  • 扩展性:如果数据量或用户数量随时间不断增加,或者急剧增加,该解决方案是否能继续发挥作用?
  • 兼容性:解决方案是否为开放的,并且能使用标准协议与第三方数据源和服务集成?
  • 灵活性:如果数据需求或模型发生变化,解决方案能否适应不断变化的环境?
  • 工程性:能否简单快捷地调试训练模型中的错误输出?

最后,需要根据人工智能领域广为人知的“可解释性”(即决策质量)来评估解决方案的需求。与可解释性有关的标准包括:

  • 偏见:如何确保人工智能系统不会基于训练数据、模型或目标函数的缺点对世界存在偏见(或者对存有偏见的世界保持公正的态度)?如果其人类创造者下意识或潜意识地存有偏见呢?
  • 公平公正:如果决策是基于人工智能系统制定的,如何确认这些决策是否公平公正?在这种环境中,公平公正意味着什么——对谁公平?
  • 因果联系:该模型除了提供正确的推理之外,是否还能解释一些基础现象?
  • 透明性:针对基于人工智能的洞察给出的解释,用户能否理解?在什么样的情况下,所发现的结果可以被质疑?
  • 安全性:无论用户对得出结论的过程了解与否,如何增加用户对人工智能系统可靠性的信心?

第 5 步 纵向扩展概念验证

现代平台的性能优化

截至目前,你已经定义了问题,设计了解决方案,分析了数据且建立了模型。概念验证已成功构建、测试和部署。那接下来应该做什么呢?

积极的用户体验有利于提升用户需求,以获得更大的成功。但是,概念验证也会因此遭遇风险,成为受到过多关注的牺牲品。你可以采取一些措施,确保你的概念验证持续保持成功,为更广泛的人工智能战略提供支持:

  • 纵向扩展推理能力。人工智能不是以线性方式扩展的——例如,从单节点配置迁移后,50 个处理器并不一定会带来 50 倍的性能。你仍然需要利用在单节点配置中采用的很多方法来测试和优化多节点配置。
  • 纵向扩展更广泛的基础设施。为确保人工智能获得成功,你需要验证推理链路中的每一个环节。检查现有的技术平台、网络和存储,以增加可用的数据量,改善时效性和延迟。此举将最大限度减少未来遭遇瓶颈的可能性,同时最大限度提高从数据源中获得的价值。
  • 调整和优化概念验证解决方案。随着时间推移,你会积累更多的技能,用于提升和增强你所部署的人工智能解决方案。为了获得更好的结果,你可以优化数据监管和打标签等领域的软件,也可以尝试训练和部署新模型。
  • 横向扩展至其它业务场景。你的概念验证可能涵盖其它业务领域的应用,例如预测性维护解决方案之前被部署到制造环境的某一个区域,现在可对其实施扩展。你可以采用一组方法来管理如何在更广泛的用户群内扩展概念验证。
  • 管理和运营规划。就本质而言,许多人工智能应用案例都要求系统实时执行推理,而不是在离线或批处理模式下执行。此外,随着时间推移,可能需要重新训练并更新模型。这些因素对服务交付提出了一些额外要求。要确保预先分配了足够的时间和技能资源,以便继续提供概念验证。

原文链接:https://www.shangyexinzhi.com/article/details/id-125177/

编辑于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券