网易有道AI再发力 离线NMT离线OCR堪比联网效果

继去年4月推出有道神经网络翻译,网易有道近日公布了又一AI大动作——推出离线神经网络翻译(离线NMT)以及离线文字识别(离线OCR)。

据悉,有道是目前国内为数不多能够实现离线NMT和离线OCR的公司,并且能够在离线的状态下,保持高质量的翻译和识别效果。该技术已于有道翻译官等产品中上线,能够实现高质量的离线拍照翻译,更好地解决出国旅行的语言翻译问题。

离线NMT,翻译效果依然准确

一般而言,离线翻译相对于在线翻译,最大的问题就是质量不高。为了攻克这个难题,有道技术团队在离线模型、训练数据方面做了大量的针对性的优化和调整,使得即使在没有网络的情况下,仍然能够保证高质量的翻译。

目前有道离线翻译仍采用神经网络翻译模型,翻译效果不仅高于在线SMT(统计机器翻译),与同类竞品的对比中,有道离线NMT翻译质量处于领先。

以以下一段BBC news的一条新闻导语为例,原文是:

“More than a century ago, an antiquities dealer from Jerusalem claimed he had discovered an ancient version of the book of Deuteronomy. But was it a fake?”

通过有道离线NMT与其他离线NMT对其进行翻译,对比显示,有道离线NMT的翻译结果更符合人类语言习惯,而且对于特殊地名、人名有道离线NMT也都能精准翻译。

(有道与其他离线NMT翻译结果对比.英译中)

再以一段中文语料为例原文是:

“这几年关于人工智能的讨论不绝于耳。人们一边早已习惯了种种“黑科技”对生活潜移默化的影响,一边对让世界翻天覆地的人工智能技术叹为观止。”

依然让三款离线NMT进行翻译,结果也显示出,有道离线NMT的翻译结果更加流畅、长短句断句清晰、时态翻译也更符合英文的语法习惯。

(有道与其他离线NMT翻译结果对比.中译英)

离线OCR识别 准确度堪比联网效果

有道自主研发的文字识别OCR技术,是业内效果最好的文字识别技术之一,其对图片中标准文字识别率达97%,对于图片中特殊文字识别率也可达90%。

而有道近日推出的离线OCR,识别率依然很高,甚至由于在本地处理的优势,离线OCR识别速度比联网更快,不到1秒就能完成。而且对于斜体、曲面、折叠等非平整的物体都能高质量识别,所支持的种类也达十几种,包括中英繁、日韩、拉丁语(葡萄牙、意大利、西班牙、法语、罗马尼亚、波兰)、俄语、荷兰、德语、挪威、丹麦、印地语等。

而离线NMT及OCR的推出,也第一时间应用在了有道旗下产品中,例如有道翻译官的离线拍照翻译功能,在即使没有网络的情况下,依然实现高质量的拍译效果。而该功能的使用场景十分广泛,例如不少国人出国旅游都会遇到网络不稳定或者没有网络的情况,利用有道翻译官离线拍照翻译,就能很好的解决这一问题。

有道翻译官离线拍照翻译(曲面物体及日文)

有道翻译官拍照翻译(倾斜角度)

有道是国内最早进入机器翻译领域的公司,十年来一直聚焦中文与其他语言之间的翻译,通过不断提升机器翻译的质量,为用户带来高质量的翻译体验。自去年4月,有道神经网络翻译上线后,其带来的翻译质量提升是过去十年的总和。

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180131C0YYFI00?refer=cp_1026

扫码关注云+社区