微软人工智能新技术可以根据文本内容凭空绘制图像

文章来源：企鹅号 - 数码频道

腾讯数码讯（Bear）微软今天推出一款全新的人工智能技术，它是一种“自动绘图机器人”。这款机器人可以通过文本的文字来描述创建图像，同时也可以自动为那些不包含文本的图像添加细节。这表明人工智能技术本身也能拥有一定的想象力。 “如果你去必应搜索，你会看到鸟类的图片。但是在这里，所有图片都是通过电脑创建，是一个一个像素组成的。”微软在华盛顿雷德蒙德实验室深度学习技术首席研究员、研究经历Xiaodong He表示。“这些鸟儿可能并不存在于现实世界，它们只是电脑通过鸟类的特质，想象出来的画面。” 研究人员表示，这种绘图机器人能够产生各种各样的图像，包括普通的田园场景，从牲畜放牧到荒唐的“海面漂浮巴士”。微软表示，这种机器人能够通过大量的图片和文字说明的数据基础上进行训练，它能够理解如何将文字与图像匹配起来。当它学会了画一只鸟，例如当标题是一只鸟的时候，就会自动学会如何绘制一张鸟的图片。 “这是我们相信机器学习具有真正学习能力的根本原因。”他说。

绘图机器人的技术通过两个机器学习模型组成，一个是通过文本描述生成图像，另外一个就是使用文本描述来判断所生成图像的真实性。前者试图从后者中获得虚假的图片，但后者负责确定真实性。两者结合在一起，创造出更高质量的图像。特别，它还善于从更复杂的语句中提取图像。比如当其他技术可以从标题中画出“鸟”的标题时，例如如果你告诉它要画一只绿冠、黄翅膀和红腹的鸟，它的质量就会下降。在此之前，微软解释说，这种技术会生成一种模糊的“绿黄红鸟”。特别有趣的是，当没有提到具体细节时，机器人如何能填补空白就非常有趣了。基本上，由于它的训练数据，它具有一些自己的常识和想象力。在鸟的例子中，机器人通常会在树枝上画一只鸟，即使它没有在文本中说明，因为最初喂食的图像通常也会显示出类似的画面。微软还指出，与之前的技术相比，这款新机器人的图像质量提升了近三倍。当然，这并不是第一个将人工智能与艺术结合起来的例子。两者的交集有时会带来惊人的结果，比如谷歌的人工智能画出了那些有自己艺术表现的机器生成的图像。谷歌也有一个神经网络，可以猜测你正在画的是什么，以及一个自动绘图机器人，并定期详细地描述机器学习在帮助绘画方面所做的研究。其实Facebook一直也致力于研发神经网络，制作一些像飞机、汽车和动物这样的小图片，甚至在照片中创建你自己的图像化身。英伟达的研究人员用人工智能创造了电脑生成的名人。从其他方面来说，这一领域最近也取得了一系列巨大的进步。对于微软来说，教一个机器人从文本中提取图像，完成了它在计算机视觉和自然语言处理领域所做的其他工作的循环。这包括CaptionBot公司的开发成果，它可以自动为照片标注说明，还有一种技术，可以回答人们关于图像的问题，比如物体的位置或属性，这对盲人来说有很大的帮助。

对于人工智能技术在现实世界中所能提供的服务，微软有独特一些想法。它表明，这款机器人可以充当画家或室内设计师的草图绘制助手，也可以作为语音激活照片优化的工具。在未来的发展趋势上，随着计算能力的提高，这项技术可能会从电影剧本中生成动画电影，以减少动画师今天需要的体力劳动。但这项技术暂时还尚未实现。如果你仔细观察这些图像，它们几乎总会有一些瑕疵，表明它们是由机器创造的，而不是人类。比如带有蓝色喙的鸟，或者是带有奇怪形状的香蕉的水果。不过微软表示，凭借其3倍的改进，这款机器人代表了某种程度上的人工智能技术发展里程碑。来源：techcrunch

发表于: 2018-01-202018-01-20 07:40:59
原文链接：http://kuaibao.qq.com/s/DIG2018012000191300?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

微软人工智能新技术可以根据文本内容凭空绘制图像

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

微软人工智能新技术 可以根据文本内容凭空绘制图像

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

微软人工智能新技术可以根据文本内容凭空绘制图像