学习
实践
活动
工具
TVP
写文章

2018 年十大 AI 技术趋势:自动化机器学习:无需编程即可创建模型

Anand Rao、Joseph Voyles和PiaRamchandani

本文介绍了人工智能(AI)领域将带来最大影响力的一些趋势。

眼下AI备受瞩目,许多商界和政府领导人在认真思考正确的举措。但是在实验室又有怎样的进展?毕竟学术和企业研究人员发现的成果将奠定AI在未来几年的发展方向。普华永道AI创业孵化器的研究人员团队将注意力放在了技术专家和商业领袖都应该密切关注的重大动向。下面介绍了这些趋势及其重要性。

1. 深度学习理论:揭密神经网络的工作原理

它是什么:模仿人类大脑的深度神经网络已经证明了它们通过图像、音频和文本数据来“学习”的本领。不过即使深度学习已使用了十年多,还是有许多方面我们并不了解它,包括神经网络如何学习,或者为什么它们表现如此出色。这种情况可能会发生变化,这归功于将信息瓶颈原理运用于深度学习的一种新理论。实际上,该理论认为:在初始拟合阶段之后,深度神经网络将“遗忘”并压缩噪声数据(noisy data),噪声数据指含有大量额外的无意义信息的数据集,同时仍保留数据表示什么方面的信息。

为什么很重要:只有理解深度学习确切的工作原理,深度学习才能有更大的发展和应用。比如说,那样可以深入了解最佳的网络设计和架构选择,同时为安全苛求或监管应用提供更高的透明度。如果探索将这个理论运用于其他类型的深度神经网络和深度神经网络设计,预计会看到更多成果。

2. 胶囊网络:模拟大脑的视觉处理本领

它是什么:胶囊网络(capsulenetwork)是一种新型的深度神经网络,它处理视觉信息的方式与人类大脑基本上如出一辙,这意味着它们可以保持层次关系。这与使用最广泛的神经网络之一:卷积神经网络形成了鲜明对比,卷积神经网络没有将简单对象和复杂对象之间重要的空间层次关系考虑进来,因而导致错误分类、错误率很高。

为什么很重要:对于典型的识别任务而言,胶囊网络有望通过减少错误来提高准确率,幅度高达50%。它们还不需要同样多的数据来训练模型。预计会看到胶囊网络广泛应用于许多问题领域和深度神经网络架构。

3. 深度强化学习:与周围环境进行交互以解决商业问题

它是什么:这种神经网络的学习方式是通过观察、行动和奖励,与周围环境进行交互。深度强化学习(DRL)已用于学习游戏策略,比如Atari和Go,包括击败人类冠军的著名的AlphaGo软件。

为什么很重要:深度强化学习是所有学习技术中通用性最强的,所以它可以用于大多数商业应用。与其他技术相比,它训练模型所需要的数据较少。而尤其抢眼的是,它可以通过模拟来加以训练,因而完全不需要标记数据。鉴于这些优势,预计明年会出现更多的商业应用结合深度强化学习和基于代理的模拟。

4. 生成式对抗网络:配对神经网络以促进学习、减轻处理负担

它是什么:生成式对抗网络(GAN)是一种非监督式深度学习系统,通常部署两个竞争型神经网络。一个网络即生成器(generator)创建与真实数据集一模一样的虚假数据。第二个网络即鉴别器(discriminator)获取真实数据和合成数据。随着时间的推移,每个网络都不断改进,从而让这对网络能够学习特定数据集的整个分布情况。

为什么很重要:生成式对抗网络让深度学习可以处理种类更广泛的非监督式任务,这些任务要么标记数据不存在,要么获得数据的成本太过高昂。它们还减轻了深度神经网络所需的负担,因为这两个网络分摊负担。预计会看到更多的商业应用(比如网络检测)采用生成式对抗网络。

5.精益增强数据学习:克服标记数据挑战

它是什么:机器学习(尤其是深度学习)最大的挑战是有大量的标记数据来训练系统。两种广泛的技术有助于解决这个问题:(1)合成新数据,(2)将针对某一个任务或领域训练的模型迁移到另一个任务或领域。一些方法让这两种广泛的技术成为“精益数据”学习技术,比如迁移学习(transferlearning,将从一个任务/领域学到的洞察力迁移到另一个任务/领域),或一次性学习(one-shot learning,迁移学习应用到极端情况下,在只有一个相关例子,甚至没有例子的情况下学习)。与之相仿,通过模拟或插值来合成新数据有助于获取更多的数据,因而增强现有的数据以改善学习。

为什么很重要:使用这些技术,我们可以解决一系列更多的问题,尤其是历史数据较少的问题。预计会看到更多种多样的精益增强数据,以及不同类型的学习运用于一系列广泛的商业问题。

6. 概率编程:简化模型开发的语言

它是什么:这是一种高级编程语言,更容易让开发人员能够设计概率模型,然后自动“解答”这些模型。有了概率编程语言,就可以重复使用模型库,支持交互式建模和形式验证,并提供促进通用模型类别中的泛型高效推理所必不可少的抽象层。

为什么很重要:概率编程语言能够适应不确定、不完整的信息,而这类信息在商业领域司空见惯。我们会看到这些语言得到更广泛的采用,预计它们还会运用于深度学习。

7. 混合学习模型:结合为不确定性建模的多种方法

它是什么:不同类型的深度神经网络(比如GAN或DRL)已经在性能和广泛应用方面展现出了大好前景,适用于许多不同类型的数据。然而,深度学习模型无法像贝叶斯方法或概率方法那样为不确定性建模。混合学习模型结合了这两种方法,集每种方法的优点于一身。混合模型的几个例子是贝叶斯深度学习、贝叶斯GAN和贝叶斯条件GAN。

为什么很重要:有了混合学习模型,就可以扩大可处理的商业问题的种类,包括具有不确定性的深度学习。这可以帮助我们提升模型的性能和可解释性,进而会促使得到更广泛的采用。预计会看到更多的深度学习方法获得贝叶斯方法,而概率编程语言开始会结合深度学习。

8. 自动化机器学习(AutoML):无需编程即可创建模型

它是什么:开发机器学习模型需要一个耗时、专家驱动的工作流程,这个流程包括数据准备、特征选择、模型或技术选择、训练以及调优等。AutoML使用许多不同的统计和深度学习技术,旨在使这个工作流程实现自动化。

为什么很重要:AutoML是AI工具大众化的一部分,让商业用户能够在编程方面没有扎实背景的情况下开发机器学习模型。它也有望缩短数据科学家用来创建模型的时间。预计会看到更多的商业AutoML软件包、更庞大的机器学习平台里面整合AutoML。

9. 数字孪生:虚拟复制品不仅仅用于工业领域

它是什么:数字孪生(digitaltwin)是一种虚拟模型,为详细深入地分析和监控物理系统或心理系统提供便利。数字孪生这个概念起源于工业界,广泛用于分析和监控风车农场或工业系统之类的系统。现在,使用基于代理的建模(用于模拟自主代理的行为和交互的计算模型)和系统动力学(计算机辅助的策略分析和设计方法)行为,数字孪生被运用于分析和监控非物理对象和流程,包括预测客户行为。

为什么很重要:数字孪生有助于促进物联网(IoT)的发展和更广泛的采用,为预测性诊断和维护物联网系统提供了一条途径。展望未来,预计数字孪生在物理系统和消费者选择建模中会得到更广泛的使用。

10. 可解释的AI:了解黑盒子

它是什么:如今使用的机器学习算法种类繁多,这些算法可以在各种不同的应用中感知、思考和行动。然而其中许多算法被认为是“黑盒子”,它们如何得出结果方面几乎不为人知。当下可解释的AI蔚然成风,旨在开发这种类型的机器学习技术:在保持预测准确性的同时,生成更易解释的模型。

为什么很重要:可解释、可证明、透明化的AI对于为技术赋予可信任性至关重要,并促进机器学习技术得到更广泛的采用。在开始大规模部署AI之前,企业会采用可解释的AI,作为一个要求或最佳实践,而各国政府在将来可能会将可解释的AI列作一项监管要求。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171217A0NP0100?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券