前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >谷歌AI版“你画我猜”背后是什么样的原理?

谷歌AI版“你画我猜”背后是什么样的原理?

作者头像
互扯程序
发布2018-10-08 16:11:36
1.3K0
发布2018-10-08 16:11:36
举报
文章被收录于专栏:互扯程序

我们先看看这个小程序是什么,打开微信小程序搜索页面,搜索“猜画小歌”,打开这个小程序,点击开始作画。小程序会先出题,告诉你画什么,20秒倒计时,你画完内容,然后谷歌AI去猜,如果猜的答案和题目匹配,则通过,进入下一题,否则失败。乍一看,怎么像是在考我的绘画能力呢,哈哈。

第一道题,让我画帆船,惜败...

再来一遍,钻戒,惨败...

Google AI

谷歌总是善于用人民群众喜闻乐见的方式“秀晒炫”自己的AI能力,这是来自 Google AI 的一款有趣的社交微信小程序,用户可以在有限的时间内进行速写涂鸦,在每一轮体验中,用户需要在规定时间内勾勒出一幅日常用品的图画(比如狗、钟表或鞋子),人工智能则需要在时间结束前猜出图画中的物体。

如果你画的东西在20秒内被谷歌人工智能猜中,则过关,反之游戏结束,还有排行榜来统计你的闯关数在好友中的排名,这也是微信小游戏一贯的社交板块。

如上图,游戏操作简单,接下来就是和AI达成默契进行“你画我猜”,如果多轮猜中,你就会进行连续的游戏解锁,然后登上朋友圈排行榜巅峰,考验各位“灵魂画手”的时候到了。

当然,也有哭着喊着让大家给评评理的,人工智能没有猜出来的这些画作,到底是谁的错?

“猜画小歌”的背后是超5000万个手绘素描数据群

猜画小歌由来自 Google AI 的神经网络驱动,该网络源自超过5000万个手绘素描的数据群,在此前谷歌推出的类似游戏《Quick, Draw!》之中,对于这个神经网络有着较多的介绍,如果你对猜画小歌很感兴趣,也可以谷歌搜索Quick, Draw!在PC端进行游戏。

如下图,谷歌所有出的猜画题,其实已经有着大量的手绘素描的数据群,你这边一边画,另一边神经网络进行快速比对。

我们点击香蕉,可以看到无数各式各样的手绘香蕉出现在你面前。

下面是关于脸的数据,看着各式各样的脸还挺有趣,值得一提的是,在谷歌的手绘素描的数据群之中,笔画的前后顺序都是纪录在内的,鼠标移动到任意一个脸上面,就会自动出现画图过程。

看到这里你是不是想说,看来人工智能也不过如此,只是在数据的基础上进行比对就好了,并不是神奇到不借助外力直接猜中我画的是什么。

在某种程度上,可以这么说,但又不准确,其实AI还进行了大量复杂的工作,谷歌对于“猜画小歌”的解释当中这样说道:计算机一直以来都是聪明的,现在有了AI以后,计算机可以用一种自然的,更接近人类的方式去理解这个世界,其中一个令人兴奋的新进展就是计算机视觉技术,它能让计算机直接理解输入的视觉信息,并由此“看到”这个世界。

谷歌说,这一技术既能在视频通话中识别出你的朋友以便加上对应的标签,也能帮助识别人类眼底诊断图像上的早期糖尿病症状。而且,得益于“神经网络”技术,一些看起来极其困难的事情,计算机也能处理得非常好:比如,通过粗糙的草图就能识别出是什么物体。现在,计算机已经能“看到”你随意涂鸦出的一团长着耳朵的墨迹可能是一只熊猫。

玩“猜画小歌”有什么技巧?

  1. 不要拖泥带水,简洁最重要。因为程序只能接受大约200个左右的输入点,如果画很多细节,反而认不出来。
  2. 如果第一次画的没有识别出来,迅速擦掉重画,不要希望AI会后期力挽狂澜。从sketch-rnn模型可以看出,画画的路径转换为latent vector,前期的数据比重很重要。
  3. 最后一招:谷歌公开了所有类别的训练样本,大家可能上这个网站(https://github.com/googlecreativelab/quickdraw-dataset)下载,看看每个类别“正确”的画法。

为什么要在中国推小程序?

因为谷歌的网页版猜画小歌,由于大家都知道的原因,没有中国的数据。这次利用微信小程序刚好收集一下中国的数据。有人还做了不同国家画画的差别,比如日本人画圆是顺时针的,而绝大多数国家是逆时针的,原因是日文中的圆的顺时针写的。韩国和俄罗斯用户脑中,最直觉性的椅子图像是侧放的,而美国、德国、巴西、南非都是正面放置的。后续基于这个大样本,还能分析出很多好玩的东西。

什么是“神经网络”技术?

神经网络(Neural Network,NN)或类神经网络,在机器学习和认知科学领域,是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。

神经网络由大量的人工神经元联结进行计算,大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统,通俗的讲就是具备学习功能。典型的神经网络具有以下三个部分:结构(Architecture);激励函数(Activity Rule);学习规则(Learning Rule)。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-09-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 互扯程序 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云开发 CloudBase
云开发(Tencent CloudBase,TCB)是腾讯云提供的云原生一体化开发环境和工具平台,为200万+企业和开发者提供高可用、自动弹性扩缩的后端云服务,可用于云端一体化开发多种端应用(小程序、公众号、Web 应用等),避免了应用开发过程中繁琐的服务器搭建及运维,开发者可以专注于业务逻辑的实现,开发门槛更低,效率更高。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档