从绘画,数据中心应用到地震预测,AI无处不在

#GAN_Paint: 学习用AI来画画

MIT的研究人员找到了可以从训练好的GAN中提取更多信息的办法,从而让GAN可以识别网络中与特定视觉概念相关的特定“神经元”。他们还为此建立了一个网站,允许任何人都可以学习并使用这个系统进行绘画,就好比是一个画家辅助你对想绘画的区域进行喷涂,例如你对图画中的天空进行喷涂,然后软件会激活GAN中的相关神经元对该区域绘画。

Why it matters

这样的演示为人们提供了一种更自然的方式去与当代人工智能研究进行交互,并帮助我们发展关于技术行为的直觉。

在这里用AI绘画:

GANpaint (MIT-IBM Watson AI Lab website).

有关该项目的更多信息:

GAN Dissection: Visualizing and Understanding Generative Adversarial Networks (MIT CSAIL).

#DeepMind表示:未来AI安全问题取决于学习回报函数的智能体

“历史研究表明,人类指定的回报函数很脆弱,容易造成智能体的不安全行为”

DeepMind的研究人员制定了一套长期的策略,用于创建AI智能体,这些智能体可以在人类难以难以构建适合的回报函数的复杂领域中 实现人类所需的功能。这其中的基本思想为:为了创建安全的AI智能体,我们希望智能体通过从用户(通常为人类)收集信息并用来学习回报函数。根据DeepMind的说法,这种方法的优点在于它适用于有可能变得比人类更聪明的智能体:“使用奖励模型训练的智能体可以在训练下一个智能体的时候协助使用者进行评估这个过程”。DeepMind认为这种方法具有三个属性,使其可被研究人员采用,即可扩展性,经济性,实用性。

研究人员说这些想法“为今天的实证研究做好准备”。该公司认为“Deep RL是一种解决实际问题的特别有前景的技术。然而,为了发挥其潜力,我们需要在缺乏明确的奖励功能的情况下训练智能体。“这个研究议程概述了如何做到这一点。

不过,回报模型仍旧面临如下一些挑战:

l 反馈量(需要多少数据才能让代理成功学习奖励功能);

l 反馈的分布(代理人访问新的状态,导致它产生更高的感知奖励,用于做出实际上次优的行动);

l 奖励黑客攻击,即智能体找到一种方法来利用任务给予自己的奖励,导致它学习一种不能反映用户隐含表达的需求的功能;

l 不可接受的结果(采取人类可能永远不会批准的行动,例如工业机器人打破自己的硬件来完成任务;或者个人助理自动写一个非常粗鲁的电子邮件);

l 奖励结果差距(最优奖励模型和学习的奖励函数之间的差距)

DeepMind认为这些挑战中的每一个都可能通过一些特定的技术方法来处理,而现如今确实有几种不同的方法可以解决以上每一个挑战。

Why it matters

人类赋权:撇开让人工智能体学会在困难领域做困难的事情而不会对人类造成伤害的一般用途不谈,这个研究议程还暗示了另外一些东西:虽然论文中没有直接讨论,但这个议程隐含的是它提供了一种赋予人类以AI能力的方法。如果人工智能系统的能力继续扩大,那么在短短几十年内,我们可能会在社会中建立大量人机交互的超大型人工智能系统。

扩展阅读:

Scalable agent alignment via reward modeling: a research direction (Arxiv).

#Facebook认为其数据中心的深度学习需求在3年内增长了3.5倍:

“Facebook的工作负载今天看起来是什么样子,未来就可能会是什么样子“

Facebook的一组研究人员试图描述公司数据中心运行的深度学习推理工作负载的类型,并预测这将如何影响Facebook未来设计其基础架构的方式。

AI数据中心的硬件:那么AI-first数据中心需要什么样的硬件? Facebook认为服务器的构建应考虑到以下问题:高内存带宽和嵌入容量;支持强大的矩阵和矢量引擎;用于小批量推理的大型片上存储器;支持半精度浮点计算。

这种推论,有什么好处? Facebook在其数据中心中有以下主要的人工智能用例:提供个性化的排名或推荐;内容理解;和视觉以及自然语言理解。

Facebook预计这些工作负载将在未来得到发展:对于推荐者,将开始将时间纳入事件概率模型,并想象在其模型中使用更大的嵌入将增加其内存需求;对于计算机视觉,希望通过将预先训练的模型微调到特定数据集上来进行更多的传递学习,以及探索更多卷积类型,不同批量大小,以及移动到更高分辨率的图像以提高准确性;对于语言,希望探索更大的批量大小,评估新的模式类型,如transformer模型;并转而部署更大的多语言模型。

数据中心工作负载:Facebook数据中心的深度学习应用程序“具有多种计算模式,其中矩阵不一定具有‘漂亮’的方形形状。除了完全连接和卷积层之外,还有许多‘长尾’运算符。因此,除了矩阵乘法引擎外,硬件设计人员还应该考虑通用和强大的矢量引擎,“研究人员写道。

Why it matters

这样的论文让我们了解了大规模部署深度学习应用程序所需的所有繁琐工作,并指出了计算机设计如何因这些工作负载需求而发生变化。 Facebook研究人员写道:“为当前和未来的DL模型共同设计DL推断硬件是一个重要但具有挑战性的问题。”

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181207G1EWSO00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券