谷歌AI版“你画我猜”背后是什么样的原理?

我们先看看这个小程序是什么,打开微信小程序搜索页面,搜索“猜画小歌”,打开这个小程序,点击开始作画。小程序会先出题,告诉你画什么,20秒倒计时,你画完内容,然后谷歌AI去猜,如果猜的答案和题目匹配,则通过,进入下一题,否则失败。乍一看,怎么像是在考我的绘画能力呢,哈哈。

第一道题,让我画帆船,惨败...

再来一遍,钻戒,惨败...

Google AI

如果你画的东西在20秒内被谷歌人工智能猜中,则过关,反之游戏结束,还有排行榜来统计你的闯关数在好友中的排名,这也是微信小游戏一贯的社交板块。

如上图,游戏操作简单,接下来就是和AI达成默契进行“你画我猜”,如果多轮猜中,你就会进行连续的游戏解锁,然后登上朋友圈排行榜巅峰,考验各位“灵魂画手”的时候到了。

当然,也有哭着喊着让大家给评评理的,人工智能没有猜出来的这些画作,到底是谁的错?

“猜画小歌”的背后是超5000万个手绘素描数据群

猜画小歌由来自 Google AI 的神经网络驱动,该网络源自超过5000万个手绘素描的数据群,在此前谷歌推出的类似游戏《Quick, Draw!》之中,对于这个神经网络有着较多的介绍,如果你对猜画小歌很感兴趣,也可以谷歌搜索Quick, Draw!在PC端进行游戏。

如下图,谷歌所有出的猜画题,其实已经有着大量的手绘素描的数据群,你这边一边画,另一边神经网络进行快速比对。

我们点击香蕉,可以看到无数各式各样的手绘香蕉出现在你面前。

下面是关于脸的数据,看着各式各样的脸还挺有趣,值得一提的是,在谷歌的手绘素描的数据群之中,笔画的前后顺序都是纪录在内的,鼠标移动到任意一个脸上面,就会自动出现画图过程。

看到这里你是不是想说,看来人工智能也不过如此,只是在数据的基础上进行比对就好了,并不是神奇到不借助外力直接猜中我画的是什么。

在某种程度上,可以这么说,但又不准确,其实AI还进行了大量复杂的工作,谷歌对于“猜画小歌”的解释当中这样说道:计算机一直以来都是聪明的,现在有了AI以后,计算机可以用一种自然的,更接近人类的方式去理解这个世界,其中一个令人兴奋的新进展就是计算机视觉技术,它能让计算机直接理解输入的视觉信息,并由此“看到”这个世界。

谷歌说,这一技术既能在视频通话中识别出你的朋友以便加上对应的标签,也能帮助识别人类眼底诊断图像上的早期糖尿病症状。而且,得益于“神经网络”技术,一些看起来极其困难的事情,计算机也能处理得非常好:比如,通过粗糙的草图就能识别出是什么物体。现在,计算机已经能“看到”你随意涂鸦出的一团长着耳朵的墨迹可能是一只熊猫。

玩“猜画小歌”有什么技巧?

不要拖泥带水,简洁最重要。因为程序只能接受大约200个左右的输入点,如果画很多细节,反而认不出来。

如果第一次画的没有识别出来,迅速擦掉重画,不要希望AI会后期力挽狂澜。从sketch-rnn模型可以看出,画画的路径转换为latent vector,前期的数据比重很重要。

最后一招:谷歌公开了所有类别的训练样本,大家可能上这个网站(https://github.com/googlecreativelab/quickdraw-dataset)下载,看看每个类别“正确”的画法。

为什么要在中国推小程序?

因为谷歌的网页版猜画小歌,由于大家都知道的原因,没有中国的数据。这次利用微信小程序刚好收集一下中国的数据。有人还做了不同国家画画的差别,比如日本人画圆是顺时针的,而绝大多数国家是逆时针的,原因是日文中的圆的顺时针写的。韩国和俄罗斯用户脑中,最直觉性的椅子图像是侧放的,而美国、德国、巴西、南非都是正面放置的。后续基于这个大样本,还能分析出很多好玩的东西。

什么是“神经网络”技术?

神经网络(Neural Network,NN)或类神经网络,在机器学习和认知科学领域,是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。

神经网络由大量的人工神经元联结进行计算,大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统,通俗的讲就是具备学习功能。典型的神经网络具有以下三个部分:结构(Architecture);激励函数(Activity Rule);学习规则(Learning Rule)。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180905B0MMWX00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券