前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Gboard的全新手写识别AI可以减少40%的错误

Gboard的全新手写识别AI可以减少40%的错误

作者头像
AiTechYun
发布2019-05-13 09:27:37
9050
发布2019-05-13 09:27:37
举报
文章被收录于专栏:ATYUN订阅号ATYUN订阅号

作者:bie管我叫啥

发布:ATYUN订阅号

谷歌在Gboard中改进了手写识别功能,使用更快的AI系统,错误比其原来的机器学习模型少20%到40%。

高级软件工程师Sandro Feuz和Pedro Gonnet写道,“机器学习的进步促成了新的模型架构和训练方法,允许修改初始方法且构建一个单一的模型,对整个输入进行操作,我们在今年年初在Gboard为所有基于拉丁语脚本的语言推出了这些新模型。”

大多数手写识别器都使用触点来识别手写的拉丁字符。手写输入被表示为一个笔画序列,这些笔画依次包含时间戳点的序列。Gboard首先对触点坐标进行归一化处理,以保证不同采样率和精度的设备之间的触点坐标保持一致,然后将其转换为计算机图形学中常用的三次贝塞尔曲线参数曲线序列。

Feuz和Gonnet说,这些序列的主要优势在于,它们比输入点的底层序列更紧凑。在这一端,每条曲线都由一个由起点、终点和控制点定义的多项式(变量和系数的表达式)来表示。单词“go”可能包含186个这样的点,代表字母G的四条三次贝塞尔曲线(和两个控制点),字母O由三条曲线组成的序列表示。

这些序列被输入到一个训练有素的递归神经网络中,以识别所写字符,这是一个双向准递归神经网络(QRNN),能够有效并行化的网络,因此具有良好的预测性能。

重要的是,QRNN还保持了权重的数量,即组成网络的数学函数或节点之间的连接强度,这些函数或节点相对较小,减少了文件大小。

那么AI模型如何制作曲线的正面或反面?答案是通过产生列和行的矩阵,其中每列对应于一个输入曲线,并且每行对应于字母表中的字母。网络的输出与基于字符的语言模型组合,该语言模型将奖励奖励到语言中常见的字符序列并且对不常见的序列进行惩罚,并分别将接触点序列转换为与单个曲线对应的较短序列。最后,给定一组曲线序列,基于QRNN的识别器输出字符概率序列。

Gboard的手写识别堆栈在设备上运行,这是团队通过将识别模型(在谷歌的TensorFlow机器学习框架中训练)转换为TensorFlow Lite模型而实现的壮举。与完整的TensorFlow实施相比,这不仅可以降低推理时间,还可以减少Gboard的存储空间。

团队表示,“我们将继续推动改进拉丁语言语言识别器,手写团队已经在努力为Gboard中所有支持的手写语言推出新模型。”

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-03-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 ATYUN订阅号 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档