神经网络造“汉字”新技能全开,biangbiang面自愧不如

李林 发自 学院路 量子位 出品 | 公众号 QbitAI

正所谓古有仓颉,今有神经网络。

最近,谷歌大脑研究员David Ha做了个让神经网络和你一起写“汉字”的网页版Demo。你在页面上写几笔,神经网络会根据你写出来的部分,补完一个“汉字”。

它的名字叫Kanji-RNN,创作过程就像这样:

据网友探索和量子位自行测试,在页面上画圈圈有一定概率得到惊喜——这个Kanji-RNN可能会愣一下,甚至毫无反应。

如果你不画圈圈,很多时候会得到脑洞异常开阔的“伪汉字”。比如:

这是量子位遇到的一些未完成品,如果真的让它无限开“脑洞”,恐怕biangbiang面都要甘拜下风了。

Kanji-RNN模型是什么结构、如何训练出来的呢?

David Ha没有详细介绍,不过根据名字、简介信息链接到的页面、他以往做的工作,可以推测一二。

首先,它的名字叫Kanji-RNN。我们起码可以看出,这个模型是用循环神经网络来预测下一笔该写什么、写在哪的;

其次,David Ha在Google参与的一项大工程,就是那个让你教机器画简笔画的Sketch-RNN,他之前在GitHub上发布的旧版Sketch-RNN中,就包含了训练神经网络写汉字的部分,还写过一篇博客介绍如何用Sketch-RNN来生成汉字,所用的数据集是KanjiVG;

而如今的Kanji-RNN页面上的简介信息,并没有链接到原来的代码,而是链接了TensorFlow官方账户下的一个Sketch-RNN-JS,可见和原来的有一定差异,以网页Demo的形式呈现,大概是借助了TensorFlow.js的力量。

总之,这应该是一个以Sketch-RNN的JavaScript实现为基础,用KanjiVG训练的卷积神经网络,与之前广受欢迎的Google神经网络画简笔画系列同宗同源。

说到这儿,你大概也看出来量子位为什么要给“汉字”加引号了。一是因为它并不会真的用你的笔画匹配真正的汉字,而是根据你的笔画“创造一个像汉字的图形”,很多时候写出来的都实在不像字;另一个原因呢,就在它的名字Kanji-RNN,和数据集KanjiVG里。

这里的Kanji和我们日常所写的字略有不同,指的是日语里用到的那些汉字,数量比我们用到汉字少,而且经过了霓虹国人民的再创作。

根据训练集的指引,它们长这个样子:

对于那些向往神秘东方的美国人民来说,Kanji-RNN的魅力不言而喻,在Reddit、HackerNews等论坛上都大受欢迎。

而从小写汉字的中国人,从Kanji-RNN中大概能得到不一样的乐趣:量子位就一心想让它写个认识的汉字出来,一上午深陷其中不能自拔。

你也试试?

http://otoro.net/kanji-rnn/

如果你也想自己训练一个,可以从下面这两个地方找找灵感。

  • Sketch-RNN的JS代码: https://github.com/tensorflow/magenta-demos/blob/master/sketch-rnn-js/README.md
  • 很久以前的Sketch-RNN代码: https://github.com/hardmaru/sketch-rnn/

如果你不知道量子位说的“Google用神经网络画简笔画”是怎么回事,一定要玩一下这个不容错过的小游戏: https://quickdraw.withgoogle.com/

当然,如果你想严肃地探讨这件事儿,这篇论文再合适不过啦: A Neural Representation of Sketch Drawings David Ha, Douglas Eck https://arxiv.org/abs/1704.03477

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2018-06-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏携程技术中心

携程2015 Open House获奖项目:银行卡扫描识别

银行卡扫描识别 Ctrip Tech 背景介绍: 图像识别是人工智能的一个重要领域 。为了编制模拟人类图像识别活动的计算机程序,人们提出了不同的图像识别模型。图...

45050
来自专栏CVer

NIPS 2018 收录论文完整清单

根据谷歌学术公布的2018年最新版学术指标(Google Scholar Metrics,GSM)榜单,NIPS在人工智能类目中位列第一,h5指数134。同时,...

95910
来自专栏量子位

Chrome暗藏的恐龙跳一跳,已经被AI轻松掌握了

作为一个Google Chrome浏览器的用户,当你看到上面那个页面时,不要沮丧。换个角度一想,墙内还能有更多的Play时间哦~

12830
来自专栏木子昭的博客

泰坦尼克乘客存活状况(决策树案例)

1912年4月15日凌晨2点20分,“永不沉没”的“泰坦尼克”走完了它短暂的航程,缓缓沉入大西洋这座安静冰冷的坟墓。 ? 欢迎你们说我幼稚荒诞,也欢迎你...

370120
来自专栏数据小魔方

堆叠柱图

今天你要跟大家分享的图表是——堆叠柱图! ▽▼▽ 首先还是来看堆叠柱图所用到的数据组织结构: ? 利用以上数据插入图表——柱形图(簇状)。 ? 然后为工资数据...

35380
来自专栏IMWeb前端团队

h5 geolocation 的那些事~

在讲h5 的geolocation API之前,让我们先了解一下当前国内地理坐标系现状 当前国内地理坐标系 国际坐标系:国际标准,国际地图提供商使用的坐标系 火...

28480
来自专栏Python小屋

Python绘制时间序列数据的时序图、自相关图和偏自相关图

时序图、自相关图和偏相关图是判断时间序列数据是否平稳的重要依据。 本文涉及的扩展库numpy、pandas、statsmodels一般可以使用pip进行在线安装...

56140
来自专栏思影科技

AJP纵向研究:抑郁儿童脑发育与快感缺乏及其青春期物质依赖风险的联系

23960
来自专栏阮一峰的网络日志

巧用Photoshop进行科学研究

Photoshop CS3 Extended是一个强大的软件。你可以用它,让你的报名照变得漂亮一些,然后上传到社交网站上;你也可以将一个名人的脑袋,移植到一张裸...

20220
来自专栏鸿的学习笔记

The Brain vs Deep Learning(三)

生物信息处理的复杂性不是以蛋白质信号传导级联为结束,100亿个蛋白质不是完成其任务的工人的随机汤,而是这些工作者被设计为具有特定数量以服务于与目前相关的特定功能...

7120

扫码关注云+社区

领取腾讯云代金券