学习
实践
活动
工具
TVP
写文章

微软人工智能新技术 可以根据文本内容凭空绘制图像

腾讯数码讯(Bear)微软今天推出一款全新的人工智能技术,它是一种“自动绘图机器人”。这款机器人可以通过文本的文字来描述创建图像,同时也可以自动为那些不包含文本的图像添加细节。这表明人工智能技术本身也能拥有一定的想象力。 “如果你去必应搜索,你会看到鸟类的图片。但是在这里,所有图片都是 通过电脑创建,是一个一个像素组成的。”微软在华盛顿雷德蒙德实验室深度学习技术首席研究员、研究经历Xiaodong He表示。“这些鸟儿可能并不存在于现实世界,它们只是电脑通过鸟类的特质,想象出来的画面。” 研究人员表示,这种绘图机器人能够产生各种各样的图像,包括普通的田园场景,从牲畜放牧到荒唐的“海面漂浮巴士”。 微软表示,这种机器人能够通过大量的图片和文字说明的数据基础上进行训练,它能够理解如何将文字与图像匹配起来。当它学会了画一只鸟,例如当标题是一只鸟的时候,就会自动学会如何绘制一张鸟的图片。 “这是我们相信机器学习具有真正学习能力的根本原因。”他说。

绘图机器人的技术通过两个机器学习模型组成,一个是通过文本描述生成图像,另外一个就是使用文本描述来判断所生成图像的真实性。前者试图从后者中获得虚假的图片,但后者负责确定真实性。两者结合在一起,创造出更高质量的图像。 特别,它还善于从更复杂的语句中提取图像。比如当其他技术可以从标题中画出“鸟”的标题时,例如如果你告诉它要画一只绿冠、黄翅膀和红腹的鸟,它的质量就会下降。在此之前,微软解释说,这种技术会生成一种模糊的“绿黄红鸟”。 特别有趣的是,当没有提到具体细节时,机器人如何能填补空白就非常有趣了。基本上,由于它的训练数据,它具有一些自己的常识和想象力。在鸟的例子中,机器人通常会在树枝上画一只鸟,即使它没有在文本中说明,因为最初喂食的图像通常也会显示出类似的画面。 微软还指出,与之前的技术相比,这款新机器人的图像质量提升了近三倍。当然,这并不是第一个将人工智能与艺术结合起来的例子。 两者的交集有时会带来惊人的结果,比如谷歌的人工智能画出了那些有自己艺术表现的机器生成的图像。谷歌也有一个神经网络,可以猜测你正在画的是什么,以及一个自动绘图机器人,并定期详细地描述机器学习在帮助绘画方面所做的研究。 其实Facebook一直也致力于研发神经网络,制作一些像飞机、汽车和动物这样的小图片,甚至在照片中创建你自己的图像化身。 英伟达的研究人员用人工智能创造了电脑生成的名人。从其他方面来说,这一领域最近也取得了一系列巨大的进步。 对于微软来说,教一个机器人从文本中提取图像,完成了它在计算机视觉和自然语言处理领域所做的其他工作的循环。 这包括CaptionBot公司的开发成果,它可以自动为照片标注说明,还有一种技术,可以回答人们关于图像的问题,比如物体的位置或属性,这对盲人来说有很大的帮助。

对于人工智能技术在现实世界中所能提供的服务,微软有独特一些想法。它表明,这款机器人可以充当画家或室内设计师的草图绘制助手,也可以作为语音激活照片优化的工具。 在未来的发展趋势上,随着计算能力的提高,这项技术可能会从电影剧本中生成动画电影,以减少动画师今天需要的体力劳动。 但这项技术暂时还尚未实现。 如果你仔细观察这些图像,它们几乎总会有一些瑕疵,表明它们是由机器创造的,而不是人类。比如带有蓝色喙的鸟,或者是带有奇怪形状的香蕉的水果。 不过微软表示,凭借其3倍的改进,这款机器人代表了某种程度上的人工智能技术发展里程碑。 来源:techcrunch

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/DIG2018012000191300?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券