前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >王小川 GIF2017 发布搜狗海外搜索,下一个百年翻译运动或再起

王小川 GIF2017 发布搜狗海外搜索,下一个百年翻译运动或再起

作者头像
新智元
发布2018-03-27 09:42:24
6970
发布2018-03-27 09:42:24
举报
文章被收录于专栏:新智元新智元

【新智元导读】2017年1月14日极客公园创新大会(GIF2017)现场,王小川讲述人工智能如何成功落地,变成具有商业价值,以及全人类共享价值的产品,探讨人工智能与人类的终极关系的同时,也开了一场别开生面的“发布会”。现场,基于英文搜索,借助最前沿的神经网络翻译技术,搜狗的“海外搜索”服务正式亮相。这也是全球首次把深度神经元网络的翻译系统,变成完整的和搜索相关的产品。

未来两三年内,将诞生兼备“前沿技术-用户规模-价值”的产品

半个月前,AlphaGo披着Master的马甲又在围棋届杀了一个回马枪。这一次,当大家再说起人工智能,恐怕少有人觉得这个词陌生了。但是我们到底应该使用怎样的脉络,去梳理人工智能对于人类的冲击?王小川提出了一个简单的三角模型,即价值-前沿技术-用户。他表示,“这个模型不仅对于人工智能或者计算机适用,我们要将技术变成产品,最终变成一个有商业价值,或者全人类共享价值的产品,都可以使用这一模型。”

王小川进一步解读了这一模型,“如果没有技术含量,产品很难实际落地。但是有技术不一定有产品,不一定有用户规模。而即便技术、用户规模两者具备,其背后也不一定能带来很大的商业价值或者是对世界的贡献。”如语音识别、人脸识别,因为无法做判断、做选择,所以其实际带来的社会价值尚且不够,而如无人驾驶,虽然已经为未来储备巨大的用户规模且商业价值优厚,但真正能够平稳落地的产品还没有面世。“虽然今天人工智能已经成为热潮,但是我们却并没有找到一个既已经面世,同时又具有巨大用户规模,且能改变世界的技术。但是未来两到三年里,我们会看到这样的产品。”

基于深度学习,搜狗如何“过河”

王小川表示搜狗正在通过深度学习进行“武装”,以期能打造这样的产品,摸索过河。他解释道,“搜狗目前的主产品中大量使用到深度学习的方法,比如输入法,其中就应用了语音识别和图像识别,搜索同样依靠深度学习在不断对搜索引擎排序进行优化。”数据显示,目前搜狗每日用户语音识别量达2亿次,每日生产语音数据量18万小时,触及到的用户量规模巨大。王小川也坦然表示,“这些技术虽然足够前沿且已经面世,并且拥有巨大的用户规模,但是并没有对世界造成颠覆性的冲击。”

那么,借助深度学习,还可以解决什么样的问题,从而能够真正对人类社会产生巨大价值?王小川认为是“跨语言自由沟通,获得和表达完整的信息”。他以《圣经》中通天塔的故事,对翻译的意义进行了新的解读。“人类希望通过建造一个通天塔来与上帝对话,上帝却认为建造通天塔是藐视他的权威。因此上帝让不同人、不同民族开始说不同的语言。当人类沟通存在障碍,他们就失去了建造通天塔的能力。正是这种信息不对称,使得我们难以合力完成一件伟大的事情,语言就是其中重要的一个因素。”王小川表示,如果能够跨语言进行沟通,这样的技术进步重要性将与电的发明等同。

目前搜狗在翻译上已有多项产品落地,如在世界互联网大会上亮相,其后又在中国香港科技大学实现应用落地的实时机器翻译技术。随后搜狗又将翻译技术放入了搜狗输入法,当用户输入中文时,仅需点击输入法的“花键”就能直接将其翻译为英文。而在极客公园创新大会上,王小川给出的新的答案是,现场发布的“搜狗海外搜索”。

如何改写通天塔的故事:搜狗海外搜索

现场,王小川具体展示了搜狗海外搜索的用法,用户使用中文词输入时,搜索可自动将其翻译为英文,检索全球英文信息,同时将其翻译成中文以便用户阅读。通过海外搜索,用户可以对任何海外你感兴趣的事情进行搜索,包括专业词汇“青蒿素”、“细胞免疫疗法”、以及“LadyGaga”、“三体”等。王小川认为,“将翻译技术加载在搜索上,能够使得这一技术惠及每一个中国人。而搜索在翻译技术的帮助下,可以实现全球范围内的信息搜索。跨语言的沟通一旦实现,通天塔的故事将改写。”

据了解,未来,搜狗海外搜索还将持续进行品质优化,搜狗的网页搜索中也将整合翻译技术,进一步优化用户搜索体验。同时,搜狗还将投入更多机器资源,推出多级页面翻译,使得海外网页内容翻译更加完整全面,“在翻译之后,大家能用中文看到整个世界。”王小川表示。

面对机器翻译技术,乃至机器学习等技术给我们生活带来的变化,王小川重审人与机器的关系,并表示“一方面,有了机器学习之后,我们会和机器融合,人类离开机器会变得脆弱,但如果将机器做为我们身体的一部分,我们会更加强大。另一方面,当机器真的取代了我们的工作,实际是解放了精确社会分工对我们的束缚,而让我们有机会可以去做一些更有创造性的事。搜狗愿意在其中做‘人工智能带路党’,把机器的智能文明带入人的世界中去,让人获得新的自由,去寻找更多创造性的意义。

搜狗 CEO 王小川《人工智能照进现实》演讲全文

极客公园的朋友们,大家好!

今天给大家分享人工智能,其实这个话题已经谈了一年多。不知道大家算过没有,李飞飞教授给大家做了一个89页的PPT,讲了Google在研究界做了多少的工作。

去年我在极客公园的活动上,其实讲的是一个子标题:子标题:人工智能照进现实讲的是我们怎么把这么多学术科研成果,最后变成实实在在能用到的产品。

在一年的时间里面,我们学到了太多的词汇,包括AlphaGo、语音识别等等,里面有很多学术的概念。还有我们曾经叫做对偶网络、对抗生存网络等各种各样的词汇。

所以我在想,用什么样的脉络去梳理,从研究到最后每个消费者,包括人类,能够面对人工智能对我们的冲击。

这里我们提个简单的模型,这个模型不仅是对于人工智能或者计算机适用,而是我们怎么把技术变成产品,再怎么变成一个商业价值,或者全人类共享的价值,要从价值、前沿技术、用户规模三个维度来看。

我们经常收到简历,现在有个词特别高大上“全栈工程师”。就是,不仅能写前台、还写后台,我自己对自己的理解,是需要做一个“全栈的CEO”。不仅要从研究上理解、去工作,同时能够理解背后的技术,怎么做产品,以及把它变成商业价值,或者是全人类的共同价值。

在这里面,如果你一开始没有技术含量,我们知道是很难变成产品的,但是有技术不一定是有产品,不一定有用户的规模。有技术、有用户规模,也不一定背后就能带来很大的商业价值,或者是对世界的贡献。

这里面我简单做了个表,我用一个框架把人工智能现有的技术、产品给放上去。

在去年3月份,AlphaGo是一个黑科技,今天我们看到在技术层面它已经实现了,并且已经面世,但是它还没有用户规模和商业价值。AlphaGo包括图像描述,刚才李飞飞教授讲的图像描述,其实还没法形成用户规模。

互联网从业人员作为好奇者,能看到大量的很令人惊艳的科技,但是这些技术其实没让你用到,还没有走到第二步去。所以,今天在图像描述、图像的合成里,不知道大家注意到没有,像张鹏和李飞飞,都有一个风格迁移的技术,我把它称为图像合成的子方向。让大家感到很酷,但是这种产品,其实还没法形成用户的规模。

再往下,有些技术不仅是黑科技,还开始变成用户规模,像语音的识别、像人脸识别。但这两个技术在我心中,它不像机器可以做判断、做选择,最后能形成商业的价值,或者给用户带来实际的变化,影响还是不够大的。

能够看到什么东西影响大呢?我们作为一个好奇的群体,我们想,能够在无人驾驶领域,这是大家觉得这既觉得很黑科技,而且未来有很大的用户规模,并且有很大的商业价值,或者是对世界的改变。但对不起,还没有面世。

从这个维度来讲,我们会发现,今天人工智能变成所有人去追捧的一个热潮。但是,并没有找到一个既已经面世,但又同时有巨大用户规模,还有巨大改变世界能力的这样的技术。

这是我们觉得,应该在最近两三年里面,应该发生的事情。

在这个过程很难:我们能够做出技术,并且让这个技术保持领先,就是一个困难的事情。去年我分享过,有些技术刚刚回国的时候是领先的,我们开始做公司、把它变成产品,还没等到变成产品或者商业化,这个技术就开始落后了,发展特别快。因此,保持技术领先,这是一个难题。更难的是把一个技术变成产品,让很多的用户受益。更更难的是,这个技术不仅有它的用户规模,还能够去改变世界,有很大的商业上的意义和对世界的冲击。

今天我给大家分享的是,我们在做的一些尝试。

之前我的PPT这页标题叫做“AI正在过河”,但是AI是很泛的概念,在中间的子集就是以深度学习为代表的,能够更好的从答案里面,寻找规律的这样一种技术,所以现在的标题家叫做“深度学习正在过河”。

搜狗,我们的想法,第一件事情,是我们有这种技术,而且我们能够把这种技术用到搜狗的产品里面去。很多创业公司试图去构造新产品,而我们一个大的逻辑,是已经让千家万户用到产品,然后去做升级。

因此,其实深度学习已经通过搜狗武装到了牙齿,我们的主产品里面有大量的使用。比如说输入法,里面会用到语音识别和图像识别。语音识别,我们现在一天用户规模上已经做到了2亿次的识别量,。同时,一天识别生产的语音数据量,大概能到18万小时,这是巨大的语料规模。我们大概用了400台GPU服务器,来支撑这个规模。另外打开输入法,你看到我们里面有OCR的能力,你可以用手写,或者是拍一张照片里面的文字,也能做到。所以,其实我们在做一个渐进的事情。

在搜索里面也是,我昨天在硅谷,还跟Google他们的核心在沟通,Google还讲到,用深度学习,能够对于用户输入的命令去做分解。以前是靠我们人在里面统计去做规则,规则越来越多,效果并不一定好。今天靠深度学习去做,对搜索引擎的描述,它的准确率提升了30%,跟我们的值是一样的。已经成为,搜索引擎排序里面第三重要的因素。

这是深度学习,我们在搜索这个类型的公司里面,能快速把它推向使用的案例。但是,这样一个技术还没有到颠覆的程度,我觉得符合我们刚才讲的面世了、有前沿的技术、有大的用户规模,但是并不构成对世界有更大的冲击。

所以,这里面我们还会做一些新的东西,也是今天很容幸在极客公园会场,给大家发布我们一款新的产品,或者功能——搜狗海外搜索。

回到搜狗的逻辑,我们是让用户表达和获取信息更简单。通过输入法,提高了很多中国人打字中的效率,搜索让获得很多的信息。而且刚才讲,通过深度学习,使得这的产品更加聪明和丰满。

那还有什么事情再往前去解决?借助深度学习今天我们前沿的成果?在这里面,我给大家分享《圣经》里面的小故事,这有足够大的意义来阐述,就是关于通天塔的故事。

大家知道,人类很想通过自己的努力,去构造一座通天塔,能够直接跟上帝对话。上帝觉得,藐视了他的权威。因此,他就让不同的人、不同的民族,去说不同的语言。由于大家说不同语言之后,沟通变成了一个障碍。所以,人就没有能力去修建通天塔。

这是我经常引用的,由于这种信息不对称、不对等,使得我们难以合力去在一件最伟大的事情。但这里面,不仅是网络连接,而且还涉及到一件事情,就是不同民族语言不一样。

去年11月份,Google有篇很重要的论文,把机器翻译推到了一个新的高度。所以在这里面我们去畅想,如果我们在表达、获取的时候,能够让不同民族的人,包括中文、英文,能够自由的交流,获得获得他们完整的信息,这个世界会因此而变。

所以在这样的使命里面,我会认为,如果能够跨语言进行沟通,这样一个技术的进步,犹如人类发明了电一样是很重要的事情,电使得我们的生产力得到了巨大的解放。但如果能做到跨语言的沟通,地球的文明会重新改写,战争会变得更少,不同民族之间的交流会,带来新的一种新文明的产生。所以,这里面我们做了很多的工作。

一方面,在Google技术的指引下,我们完整用了这样一些技术,是基于类似于深度神经元网络的翻译模型,已经被我们掌握得非常好。

而且我们很有幸,跟清华有更多的合作,在这里面有一些技术上的经验,很快会融入我们的模型里面。所以,不仅是深度学习的网络,还有其它技术的合力。

另外我认为,我们比Google更有动力和决心,去做好翻译这件事情。Google代表技术的高度,但是它在我心中有种玩票的心态,因为它面对的不仅是中文、英文这样的事情,作为中国人我们是非常有意愿要跟英语国家、英语的世界对话,Google同时一做就是上百种语言,或者8种语言之间怎么去互译,我懂得2种语言,只能把第3种语言加进去,所以对它是一种秀肌肉的事情。

但是,对于世界上最大的一个语言-中文,我们是有非常大的动力,把它真正变成一个现实,所以说这样的一种动力的驱动下,我们实际做到产品的识别准确度,是比Google更高的,因为我们比它有更强的意愿去做好中文到英文这样的一个对译,后面有这样一些对比的评测数据。

基于这样的事情,我们已经在产品上开始去发力,有了一些黑科技。我在去年乌镇的世界互联网大会上,就首发了搜狗机器同传。然后在中国香港科技大学,我们更是把机器同传带进了实用,就是中文到英文的过程。

在乌镇大会我们叫做首秀,因为乌镇世界互联网大会,说是一个世界性的互联网大会,但是在座的观众中很多都是中国人,即便是老外,他们其实也戴了同传的耳机,所以这时发布的是一个概念性的产品。

我们在中国香港科技大学,发布这个产品的时候,下面大概有30%,真正是国外的学生,而且也没有提供其他同传的设备,直接依靠机器同传来听,事后我就问他们听懂了吗?他们说,确实用中文演讲的内容,他们也都能够听懂。这个我没有做视频的宣传,但是在网上有一些传播。

事实上,这样的技术,并不符合我刚才的理念,虽然是很好的技术,但并不是给所有人都去使用的。我们在去年年底,把这个技术放到了搜狗输入法里面去,当你在里面去敲中文的时候,只要你点个键,这句话就能把它翻译成英文,再点个键,你就能把它发送出去。所以,使得你要跟国外的朋友聊天,或者写邮件的时候,变得更加容易,这是我们输入法增加的一个功能。可以看到,点击个花键,点击翻译键,就能得到翻译的结果。

今天,我重头想给大家带来的是,之前一直保密,也是因为极客公园,我们准备的一个新产品,在这次活动上发布。我们称之为,搜狗的海外搜索。

听到这个词,我们就知道它一定是跟跨语言的翻译工作相关。它是什么呢?我们在以前搜索的时候,中文信息可能只占世界信息的10%,不会更多了。大量优质的内容是在海外,目前在大陆地区无法使用。第二,即便我们会用Google,作为一个中国人,我们确实要承认我们英文水平不够高,用中文搜索的时候没有足够的信息,要用英文搜索,去获得英文的答案,是很困难的。

因此,今天我们要发布的海外搜索产品,是给中国人用的,帮助英文不够流利,或者效果不够高的朋友。我们实现了当你用中文词输入的时候,能自动翻译成英文,去检索英文世界的内容,同时把它翻译成中文并阅读。

所以,这个产品的3个页可以看到,左边是搜索的海外英文内容,当你点个键之后,就能以中文的方式阅读它,而且提供了双语的翻译。

能干嘛用呢?就像我们之前看到,有大量我们对海外感兴趣的事情,包括专业的词汇,像细胞免疫疗法,目前网上不可避免有很多虚假的信息,这样搜索能看到海外大家是怎么做这件事的。

包括,我们想知道人工智能海外的发展,我们可以看人工智能的初创公司,这里搜索到的就是在国外最前沿的一些人工智能公司是哪些,或者我们想知道我们追的明星lady gaga,大家对她是怎么看的。我们甚至能看到,像李飞飞,我们在中国世界是这样看到她,那么在西方世界又是怎么认知她的。我们通过搜狗海外搜索,不仅能搜到10%的世界,还能搜索到90%的世界,这是(搜狗海外搜索)对我们巨大的促进。

所以,我们今天首发了这个产品,这是搜狗第一次在极客公园上进行这样的首发,而且也是全球第一次把深度神经元网络的翻译系统,变成一个完整的跟搜索相关的产品,能够惠及每个中国人。如果单独给你一个翻译产品,大家用起来很费力,但我们把它放在搜索引擎里面去,就能够使得我们有机会搜索全世界的内容。

右边有我们的二维码,今天很高兴有机会跟大家做这样的发布,欢迎大家试用。

在这背后,我们还有很多工作去做,这个翻译工作非常非常细腻,有些前沿的词汇并没有做到中英文的对应。像我昨天从美国回来,查“美联航空在线值机”,但翻译过去再翻译过来,就变成了联合航空在线值机,这里面有很多很多工作需要做透。做搜索引擎,使得我们有机会很努力的逐步去迭代。同时,我们需要把这样的搜索技术跟网页搜索做到合体,现在是单独海外搜索,之后还要跟我们的网页搜索做整合。同时,再投入更大的机器资源,使得大家能全面的浏览,不仅搜索上能做翻译,使得海外的内容能做到完整的中文阅读,翻译之后能让大家用中文看到整个世界。

所以,我们做了这样的工作之后,翻译技术如果得以解决,我们在想,到底对未来会造成怎样的变化?也是今天大会的主题。是去取代人类,还是帮助人类?在网上,已经开始有了这样的讨论。是取代人类吗?我们的翻译系统,使得把专业的翻译扔掉了,那这个人群就没有了工作。但是,对更多人有了帮助。所以,我们反复的题目是,有了机器学习、深度学习之后,究竟机器和人是什么关系?这是我两个思考的结论:

1、我在前年极客公园大会上提到“智慧的体外进化”,有了机器之后,我们要心甘情愿的跟机器合体。我们跟机器是融合的,不要孤立地看人,离开机器我们会变得更加脆弱,但如果心甘情愿的把机器当成我生命中的一部分,我们会变得更加强。

就像一只猴子,问它你希望变成人吗?猴子可能很茫然。同样问一个人,你希望变成一个超人吗?我们可能很茫然。这种成为超人的代价,是跟机器合体。

2、如果我的工作被取代了会怎样?这几天我在读的哲学书里面,又读到一个尼采的思考。他说,这个地球开始变成一个大的分工,每个人就像螺丝钉一样,做了一个局部的事情。比如说,翻译、司机,我们好象找到了一份工作,但其实被限制了我们的自由,我们精确在社会分工中完成一个原有的使命。

但是,当机器开始取代这个精确的分工之后,其实是把我们的束缚解放了,我们可以去做一些更有创造性的事情。没有这种失去,就没有新的获得。

所以从我内心里面有一句话,我是愿意做带路党,把机器的智能文明,带到人的世界里去。另一方面,我们其实对于每个被分工细化的人有所解放,强迫我们获得一种新的自由,去寻找更多创造性的意义。

这是我想产出的AI和我们之间的关系。

最后有点时间,用一分钟时间,放一下我们在乌镇和中国香港的视频,在同声传译方面今天做到的高度。

我今天给大家的演讲就到这里,希望海外搜索会成为第一款面世的,能够改变我们生活,也是能为广大用户使用的人工智能产品。

谢谢!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-01-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档