首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

有道推出国内首个实景AR翻译:支持离线、动态翻译!

4月26日,网易有道在以“AI生万物”为主题的全球移动互联网大会(GMIC)上,发布了国内首个真正的实景 AR 翻译解决方案。

有道实景 AR 翻译的整个过程完全是动态的,和出国旅行、购物等场景十分契合,并且接入了有道的离线神经网络翻译技术(YNMT),翻译质量堪比专业八级,速度极快。这比起以往的拍照翻译,体验上有了跨越式升级。

完全离线,所见即所译

有道实景 AR 翻译支持离线翻译,翻译工具最高频的使用场景就是国外旅行、海淘购物,而输入文字再翻译的效率并不高。使用有道实景 AR 翻译,只需要拿起手机扫一下,就能获取商品信息、路标提示,整个翻译过程,比扫二维码还要快。在网络不佳或没有网络的时候,也可以完成。据了解,目前有道实景 AR 翻译已经支持中英日韩四种语言。

跨越技术门槛,集合顶尖AI科技

全离线的实景 AR 翻译技术门槛很高。有道从 2016 年开始尝试,经过几次技术的实验、推翻、再实验,才有了目前的成果。在 GMIC 大会上,网易有道首席科学家段亦涛,剖析了其中融合的4项 AI 黑科技。

动态跟踪(Tracking)

不同于静态的拍照翻译,实景AR翻译,是在动态移动的情况下完成,跟随速度非常快,能精准地呈现出翻译结果。有道自主研发的动态跟踪,就是用运动预测模型去实现动态跟踪,速度能达到 90 帧/秒。“电影画面的跟踪速度是 24 帧/秒,所以有道的 Tracking 速度看起来是非常流畅的。”

AR渲染技术

后台翻译完成后,有道自主研发的 AR 引擎会在 20 毫秒内完成像素级渲染。针对一些常见的翻译语料,比如论文、化妆品包装、个人证件、产品说明书,有道实景 AR 翻译都做了专门的技术优化。在视觉呈现上,翻译结果的边缘、背景色与字色均可与原背景无缝贴合。

OCR组段分析(Layout Analysis)

段亦涛表示,“组段技术在实景 AR 翻译中非常重要,这也是为什么用户会感觉到有道的实景 AR 翻译会比谷歌更通顺。”所以,为了翻译的质量,有道使用了 OCR 组段技术训练上百万份不同类型的语料,让机器更加理解人类语言的段落层次。

离线神经网络翻译(YNMT)

有道实景 AR 翻译采用离线神经网络翻译(YNMT),提升了实景 AR 翻译的速度。而且,安装不到 100M 大小的离线包,就可以在无网络的环境下轻松翻译。

翻译领域的技术革新者

AI 爆发之后,有道几乎每年都给翻译界带来颠覆性的技术革新。

2017 年 4 月有道推出基于神经网络翻译的技术(YNMT),突破了过去统计翻译模型(SMT)的局限,翻译质量的提升是过去十年的总和。

随后,有道上线了离线的 YNMT,配合离线 OCR 技术,突破了网络环境对翻译的局限,翻译速度大幅提升,准确度堪比联网效果。

同时,为了给用户更好的语音交互体验,有道首次尝试“YNMT+智能硬件”的翻译方案,推出了有道翻译蛋。而拍照翻译和此次推出的实景 AR 翻译,则是基于视觉交互的翻译解决方案,让翻译体验再升级。总尝试“第一个吃螃蟹”的有道,已经有了深厚的技术积累,成为中国翻译技术革新的推动者。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180427A0O1NR00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券