从基层员工到CEO奖获得者,他的秘诀是……

如果用一个词来形容你的2017,是什么?

它或许是一个动词,带你回溯过去一年走过的步履足迹;

它或许是一个名词,简洁的文字里讲述着光阴的故事;

它或许是一个形容词,记录下丰富的情感,聆听内心诉求...

每个人心中都有属于自己独一无二的“流年记忆”,他叫王宇光,是我狗语音交互中心机器翻译团队技术负责人。过去的2017对于王宇光和他的团队而言是新鲜而又充满挑战的一年:从参加WMT2017机器翻译大赛、跟进并上线业内最先进的神经机器翻译框架ransformer,到参与搜狗旅行翻译宝的研发工作...一场接一场的硬仗如雨后春笋般接踵而至。

王宇光 桌面事业部 资深研究员

在加入搜狗不到两年的时间里,从一名基层员工到搜狗CEO奖获得者,王宇光说:每一份收获背后都有一份满满的感动。今天,和小编一同走进他的“网”事2017,有故事、有干货,准备好小本本了吗!

“网”事匆匆

一眨眼,时间的齿轮已经驶向了2018年,此时的王宇光来搜狗还不到两年,在这短短的600多天里,他见证并经历了搜狗在AI领域的创新与突破。毫无疑问,过去的一年是翻译团队的发力年,然而对于这些深耕于代码世界的极客们而言,从团队组建的那刻起,他们就已进入到备战状态。

“神经机器翻译”项目是小组成立后接到的第一份重量级工作,该项目的研发成果直接被应用到搜狗的王牌产品手机输入法中。16年底,随着世界互联网大会在乌镇召开,搜狗推出了搜狗机器同传技术,这也是全球首次基于神经网络的实时语音翻译技术在大型活动上的展示。组建不到半年,项目组展示出了他们在该领域的专业与实力。

成立之初,整个项目组一直处于追赶状态,工作中“快”字当前;然而上线只是一个开始,对于细节地不断打磨才是留住用户的核心所在。2017年初,他们对中译英、英译中两个翻译系统进行了全面优化,优化后的产品效果达到业界领先水平。

四料冠军

作为最早在同传领域发声的公司,搜狗的一举一动都备受业界关注。然而在机器翻译领域,我们的技术究竟达到了怎样高度,一切还要靠实力说话!

王宇光说:“去年,很多业务刚刚起步,我们一方面想打磨我们的机器翻译技术;同时,也希望借此机会证明我们的能力。”一不做二不休,他的团队成员很快投入到WMT2017的赛事筹备当中。

WMT全称Workshop on Machine Translation,是由来自欧洲和美国的高校、研究机构的研究人员联合举办的业界公认的国际顶级机器翻译比赛之一。从2006年开始到2017年,WMT一共举办了12届机器翻译比赛,每一届的角逐,都代表着全球机器翻译最尖端水准的较量。

WMT2017的机器翻译比赛,共有20多家国际知名的机构参与展示,经过激烈的竞争后,WMT官方于9月8日公布成绩:搜狗语音交互技术中心-机器翻译团队提交的中英和英中系统,获得了人工评价指标的双向第一名!

好事多磨

这是WMT首次举办中译英、英译中赛道的比赛,之前的赛事主要围绕欧洲语言到英语翻译展开,如法译英、英译德等。第一次参赛,还是一场没有经验可循的赛事,突如其来的压力或多或少地让大家紧绷的神经更加紧张。自三月底接到任务,五月底提交结果,在倒计时般的两个月中,大家不敢有一丝懈怠。在提交结果的那一周,团队成员有4、5天都在公司通宵、打地铺。

“最初参赛时,从未想过会拿冠军”,王宇光平静的说。和其它赛事有所不同,提交结果后,WMT官方会实时公布评审结果,但实时公布的结果并非最终排名。最初搜狗的系统在机器评价指标上的成绩是:中译英赛道第一名,英译中赛道第三名。

直到9月份,项目组出席在丹麦召开的EMNLP2017会议时,官方才公布了最终成绩。好事多磨,搜狗在中译英、英译中两个赛道的主要指标上都获得了第一名。其实在参加WMT2017的同时,项目组还参加了CWMT(Chinese Workshop on Machine Translation) 2017,一个由中国举办的机器翻比赛,在该比赛中,搜狗同样获得了中译英、英译中双赛道的冠军。

第一个吃螃蟹的“人”

时间进入到下半年,随着比赛结束,王光宇和团队成员暂时从紧张激烈的比赛中抽离出来,投入到核心技术的研发中,比如对当时业内最先进的谷歌ransformer神经机器翻译框架的开发。ransformer翻译框架技术对于翻译效果有很大的帮助,但如何把处于论文研究状态的技术应用到商业系统中,并非一件易事。

王宇光说:“我们团队是第一家将ransformer技术运用到线上的公司,两个月的研发,对模型优化和解码器研发逐一攻坚。8月底,搜狗的ransfomer技术已经做到了线上服务,可同时支持搜狗输入法翻译和搜狗同传的产品。”

逆流而上

最近朋友圈都被一款翻译神奇给刷屏了——搜狗旅行翻译宝。

为解决用户在跨语言交流中的障碍,搜狗在2018年1月推出搜狗旅行翻译宝。这是一项涉及到语音识别、机器翻译、语音合成、硬件制作等多领域的复杂工程,王宇光和团队成员主要负责其中离线翻译部分的研发。

我们常用的翻译服务依托于服务器,需要联网才能访问。但搜狗旅行翻译宝是一款离线翻译产品,这就要求技术人员把服务器上的运行程序、模型移植到移动设备中。由于移动设备的运算能力、内存、存储等要比服务器差很多,当把服务器端的程序移植到移动端时,将面临三大难题。

首先是模型压缩。通常情况下,模型压缩的同时伴随着效果的降低,项目组要解决的就是在保证模型减小且能够载入到移动设备的同时不损失效果。

其次,优化运算速度。服务器的运算能力是手机的上百倍,举个例子,一句话的翻译在服务器上或许100毫秒就能解决,但在离线的手机上可能要消耗5s乃至更多,速度差别之大将影响用户的使用体验。项目组需要解决的是移动设备上的运算加速问题。

再次,降低内存消耗。通常,服务器上显存消耗可能占用5GB或者更大,但移动设备的客观条件限制了内存容量,内存消耗优化变得尤其重要。

解决这三大难题远比单纯把框架推到线上棘手得多。

当时,项目组还有另一条路可以选择...

在此之前,搜狗一直沿用是翻译框架——RNN-NMT,由于RNN-NMT对于运算要求较低,如果将其应用到翻译宝产品当中,难度自然会降低不少。要么不做,要做就做到极致。秉承着这样的信念,他们选择了难度更大、效果更好的ransformer框架。现在很多公司已经把ransformer上线到云端、但还没有做到离线化,搜狗的离线语音翻译技术走在了业界的前面。

岁月往后,你我向前

一眨眼,王宇光从事该领域已有五年光景,作为一个名副其实的“老司机”,他坦言工作期间也曾迷茫过,幸运的是坚持下来了,在这个随波逐流的世界里始终坚守着技术人的极客梦。

五年间,王宇光做过处理数据等一些看起来和机器翻译关系不大的工作...但他说:“随便做一下和做好还是有差别的”,这些看似不起眼的工作也为他后来带领团队打下基础。去年,在他的带领下,其所负责、或参与的项目不仅提升了公司的品牌形象,也奠定了搜狗在业界的地位和影响力。

从零起步,一点点突破与改进;稳扎稳打,在竞争中谋先机。匠人之心不只是一句口号,新的一年,他们将更多时间投入到对产品细节的打磨,使翻译效果走向实用化。岁月往后,你我向前,在日新月异的大时代中,不变的是一代代搜狗人传承下来的工程师文化。

进入2018,搜狗同学已经开启了新一年的“战斗模式”。但在刚刚过去的一年里,我们身边也涌现出很多的榜样,有团队,有个人…比如今天的故事主人公王宇光就获得了搜狗公司2017年度CEO特别奖-卓越成就。接下来的日子里,小编会陆续和大家分享他们的故事,一同感受榜样的力量。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180410B1CJGC00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券