首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

“读文画图”,微软 AI 的想象力可能比你的还好!

此前,谷歌曾经教过人工智能如何涂鸦,不过这只是一些简单的线条,而更复杂的一些图案对于计算机来讲可能就会稍显困难。而现在,微软的研究人员已经利用人工智能技术实现了这一突破,他们可以做到将文字性的描述转成活灵活现的图像。

试想一下,你给出了一段描述,“画一只短嘴巴的黄色小鸟,而且它的翅膀必须是黑色的”然后计算机就按照你说的把这只鸟画出来了,怎么样,是不是很酷?

同时,微软首席研究员还特地强调,系统不是根据您的描述去图片库里寻找一张对应的图片,它完全是自己创作出一张图像,“计算机画出来的这只鸟可能并不存在于真实世界中,它只不过是计算机想象力的发挥而已!”

当然,任何新推出的技术都肯定或多或少面临着些许瑕疵,但不难想象,未来这项技术可以成为画家或室内设计师的得力助手,更远一点,甚至人们完全可以根据一个剧本就用计算机生成一部动画电影,想到这里,是不是所有的演员都会感到心头一颤!

微软的这个团队一开始是借助一个名为 CaptionBot 的 AI 系统来深入研究计算机视觉和自然语言处理的问题,该系统可以自动为照片添加字幕,之后,他们又创建了一个名为 SeeingAI 的 AI 系统,它的作用是为类似盲人的群体提供语音问答服务。

目前,这种计算机绘图的技术主要有两部分技术构成:生成对抗网络(GAN)和判断所生成图像质量的鉴别器(discriminator)。绘图计算机在被“灌输”了无数的图像和字母描述之后,它逐渐学会了哪种文字该匹配哪种图像。

最后,该团队还创建了一个用数学方法描述“人类注意力”的机制,这被用来从复杂的描述中获取有用的数据信息,就例如“红色的翅膀、尖锐的喙、黄色的翅膀”等等概念,这些概念对于机器来讲不是很好理解,所以需要转化成数学的方法来进行分析。

-End-

参考:

https://www.engadget.com/2018/01/18/microsoft-ai-draws-images-from-detailed-text/

本书灵感源于“TR35”,即《麻省理工科技评论》享誉全球的“35 位 35 岁以下科技创新青年”(MIT Technology Review 35)青年人才榜,如果你想一睹全球科技创新领导者背后的精彩事迹,你也一定不能错过这本书。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180119B0CYCJ00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券