讯飞输入法Android V8.1多项功能升级 AI新版上线

随着人工智能(AI)持续走红,应用领域也不断扩大。6月12日,讯飞输入法AndroidV8.1通过AI赋能,带来多项升级。除了高达98%的语音识别率和更为强大的语音修改功能,此次新增面对面翻译拍照输入,同时莫得键盘全新升级,拼音输入首选率提高等诸多优化,针对性解决输入难题,让高效表达更简单。

语音修改多候选 智能更懂你

作为业界首款搭载中文语音输入的输入法,讯飞输入法不仅做到一分钟输入400字,加入多语种口语实时翻译、超长语音输入、耳语输入、离线语音等功能,还率先在行业内做到通用语音识别率98%。同时,讯飞输入法以自然语言交互方式——语音修改来解决当前技术束手无策的2%不准确。通过使用语音口令修改、添增、删除文字等操作。由于中文拥有复杂的多样性,同音不同义的词非常丰富,这对机器而言存在理解难度。因此,讯飞输入法加入语音修改结果多候选,在机器不能准确理解语义时,通过人工选择更高效。基于Cache Base Fast Adapation技术,讯飞输入法独创的“智适应”支持一次修改自动记忆修正结果,再次输入相同内容精准识别。

对于口音和方言识别难题,讯飞输入法提出方言语音输入来解决。2017年发起“方言保护计划”,建立“中国方言库”,用智能语音留存承载传统文化积淀的方言。截至目前,讯飞输入法已支持22种方言,其中粤语、四川话、东北话等识别率均已超过90%。日前,讯飞输入法启动“方言发音人招募”公益行动,利用人工智能技术实现方言的完整复制,进而推进中国语言资源保护公益事业。

新增面对面翻译 英日韩俄聊天无压力

当下翻译功能成为“爆款”,讯飞输入法尝试将语音识别、语音合成以及机器翻译等新技术融合在一起,新增面对面翻译,支持中文与英日韩俄多语种即时翻译。

与传统机器翻译不同的是,讯飞把Attention Based Neural Network(基于注意力的神经网络)模型用于翻译应用上,使用复杂的深度神经网络和端到端的学习,尽可能多的靠大数据驱动并减少人工定义的规则和特征。不仅如此,还充分考虑使用场景,首创面对面UI交互界面,一部手机屏幕一分为二,简化了多语种翻译操作流程。例如,对话双方各讲母语时,另一方就会同步看到翻译结果;语音播报的加入,让面对面翻译有了自己的“嘴巴”,在你身边俨然有了一位翻译官,增强了翻译的实用性。

新增拍照输入 OCR智能识别

一般从文件、图片中提取文字需要手工录入大量文字,效率低下且可能出现错字。基于用户刚需,讯飞输入法新增拍照输入,轻松识别出汉字并存储在文本中。

拍照输入相当于给讯飞输入法安装了一双“眼睛”。这个新功能的用心之处是不管书本、路牌、名片还是其他纸质图中的文字,都能轻松识别并提取出来,方便用户进行编辑、归类、管理,省去大量录入的时间。令人惊喜的是,内置OCR扫描不仅能识别各类印刷体,对于手写识别准确率也高达90%以上,就算字体潦草也轻松识别。作为高效输入的一种补充,拍照输入适用于办公、商务、教育、设计等诸多应用场景,满足用户多样的需求,助力讯飞输入法成为未来最智能化的输入法。

莫得键盘升级 语音交互进化

人工智能赋能输入法不只是技术落地那么简单,未来的输入法将会是一个宽泛的概念,旨在帮助人与人之间的交流,也帮助人和物之间的沟通。从人类最自然的交互方式考虑,讯飞输入法精心打造了革新人机交互的黑科技产品,不局限于五笔、九宫格、二十六键、手写键盘,而是一个“有即是无,无即是有”的更高效的键盘形态——莫得键盘。讯飞输入法新版升级莫得键盘,颠覆传统键盘触摸按键的输入模式,通过语音交互重新定义键盘。

在不久前结束的锤子科技发布会上,罗永浩试图用TNT方式颠覆人机交互,可以看出语音交互成为提升体验至关重要的一环。使用莫得键盘输入,只凭一张嘴就能轻松打字、修改,甚至自动加标点符号,不需要学习其他技能。

如今,人工智能正在从感知智能向认知智能跨越,如今手机端的输入方式发生了巨大的变化。讯飞输入法语音输入达到实用门槛,语音交互的比重越来越大,加上对涟漪效应的理解,已经成为高粘性的工具类产品。截至目前,讯飞输入法用户规模已经突破6亿。现在讯飞输入法团队正思考如何持续用AI创新,为用户带来更多使用价值,让产品为用户提供更好的服务。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180612A22XDW00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券