首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

除了下围棋、写稿子,人工智能又来抢画家的饭碗了

如果有人让你画一只小鸟,你大概得先线条起稿、补充细节,然后着色,整个过程也得个把小时。微软最近发布了一项新的人工智能项目,名为绘画机器人(drawing bot),可以将文字转换成图画(text-to-image)。

1

对抗生成网络

何晓东是微软深度学习技术中心的负责人,也是 text-to-image 项目的核心人员之一。他说,跟网络搜索得到的图片不同,绘画机器人给你的图案都是按照一定的指令一点一点画出来的,也有可能它画出来的东西这个世界上并不存在。

绘画机器人的核心技术是对抗生成网络(Generative Adversarial Network,即 GAN),听这个是不是感觉很难懂想溜,别急,微软亚洲研究院在知乎专栏里举了个很好的例子。

女生拉男票给自己拍照,拍完第一张,女生说:你要学一下谁谁谁的构图;

拍完第二张,女生又说,你要学一下谁谁谁的调色;

拍完第三张,女生再说,你要学一下谁谁谁的感觉;

……反复几次,女生才终于认可了男票拍出来的照片。

这个男友拍照血泪史就是生成对抗网络。生成对抗网络它有两个工作模型,一个负责根据文字生成图片(generator),另一个根据文字评判生成的图片(discriminator),这两个模型不断相互博弈、又相互学习,直到 discriminator 再也没有能力判断这个图形,「生成模型」就可以出师了。

2

研究历程

这个项目并不是最近新出的,何晓东与他的团队已经研究了 5 年了。

他们最早推出过一个 Captionbot,只要你上传一张图,这个人工智能就会自动为图片配一段文字;接着,他们又将这个技术进一步发展,你可以根据图片上的事物进行提问,人工智能会回答你提出的问题。这个时期的技术,有点像小学生的看图作文、看图回答问题。

早在 2017 年 1 月份,在 arXiv.org 上就何晓东团队登载了一篇介绍 text-to-image 的论文,这项技术名为生成对抗网络(Attentional ,简称 AttnGAN)。而最近微软正在进行的 text-to-image 项目,生成的图画质量将是以前的 3 倍。

与根据图片进行文字描述技术相比,text-to-image 的难点在于,绘画机器人要描绘出更多细节,而这些细节是文字叙述中所没有的,这就要求你的人工智能自动「脑补」。

研究绘画机器人有极大的科研意义,这是计算机视觉研究(computer vision)和自然语言处理(natural language)这两个研究领域的一次融合。怎么理解呢?计算机视觉研究的是机器如何去看,也就是说让机器像人眼一样去看待这个世界、并且进行图像处理;而自然语言处理,研究的就是人与人工智能之间如何用我们日常的语言进行交流。

3

绘画机器人的实际应用

绘画机器人虽然目前仍处在研究阶段,但是界内预测,它一旦出现,将会有极大的实际用途。

比如,它可以作为画家或者设计师的助理,甚至可以帮他们完成草图。

根据何晓东的想象,绘画机器人还可以帮助电影工作者,可以根据电影剧本直接生成影片,这可以节省大量的人力。电影从业人员莫哭。

人类为谋生奋斗了这么多年,没想到最大的竞争对手却是机器人。而何晓东表示,人类和人工智能共同生活在这个地球上,双方是需要找到一种沟通的方式的,而最好的沟通方式就是语言和图像。这话好像很顺耳,但是你有没有觉得有细思极恐的感觉?

图片来源:微软官网、微软亚洲研究院

关注设计癖,发现好生活。关注设计癖微信公众号(shejipi),下载「设计癖 App」同样精彩。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180208A05JUW00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券