微软人工智能绘图机器人诞生，输入文字既能生成图片

文章来源：企鹅号 - IT大家谈

人工智能的飞速发展，已经给人类的很多工作领域带来了替代的威胁。不过，在大多数人的认识中，诸如文学、艺术、音乐等需要灵感、创意的领域，似乎很难被AI所替代。

但这一认识正在被AI机器人所打破。

继推出可写诗的机器人小冰后，近日，微软又推出一项新的人工智能技术——绘图机器人。

近日微软对外宣称正计划推出一项新的人工智能技术——绘图机器人（drawing bot）。使用者仅需说出想要绘制物体的名称，机器人便可进行相关素材的匹配，也就是说，该机器人能够根据对事物文本的描述，创造出图像，并且还能自行添加文本中没有描述的细节，展现人工智能的想象力。

上图是一个素材循序渐进的生成过程，根据鸟类体色、翅膀、短嘴等描述，drawing bot逐步将想象变成了实用性很高的草图。其原理是通过数千张配对照片和文本字幕的数据集训练，实现文字理解与相关图像匹配功能。

据悉，绘图机器人不仅能够对指令进行识别，也会结合图像中存在的细节进行想象，如上图在进行香蕉和猕猴桃素材匹配后，drawing bot额外融入了水果摊位元素。

研究人员表示，无论是普通的田园风光，还是荒诞的图像，比如漂浮的双层巴士，这个机器人都能够画出来。

微软在华盛顿雷德蒙德地区研究实验室深度学习科技中心的主要研究人员何晓东称：“如果你用必应网页搜索‘鸟’，会出来一张鸟的图片。但是这个绘画机器人，会从头开始一点点的给你画出一张鸟的图片。这只鸟可能并不存在真实世界中，只是电脑对鸟的一种想象。”

微软表示，研究人员用了许多套图像和标题的数据组来训练机器人，使它学会怎样将文字与图像匹配。比如说，机器人在学习画鸟的时候，当标题显示“鸟”，它就学会了鸟的图片是什么样的。何晓冬说：“这是我们相信机器可以学习的根本原因。”

特别有趣的是，多亏了那些训练数据，绘画机器人拥有一点基本的常识和想象，在没有提供具体细节时也会填补空白，以鸟为例子，机器人常常会画出一只站在树枝上的鸟，即使文本中并没有提到这个细节，那是因为最初给它输入了图像大部分都是这样。

这款绘画机器人的技术是由两部分机械学习模型组成，一个是从文本描述中生成图像，另一个是根据文本描述来判断所生成的图像的真实性。两相结合，创造出更高质量的图像。根据最近的研究论文显示，这款新机器人与以前的技术相比，在图像质量上提升了近三倍。

微软认为，未来该工具能够很好的担当起画家、室内设计师草图助手一职，随着更多的计算能力的成熟，甚至可以生成动画电影剧本，对于那些笔头功夫不强又有绘图兴趣的用户来说，drawing bot将是个绝佳的帮手。不过遗憾的是，目前微软认为该技术还有完善的空间，所以并未将其上线。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货