首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

搜狗王小川:从信息文明到智能文明,输入法跟搜索的未来是什么?

创客猫注:本文来源于由《麻省理工科技评论》、DeepTech深科技主办的“Meet 35--全球科技青年论坛”上,搜狗公司CEO王小川发表的主题演讲,讲述他对信息文明到智能文明的一些思考,以及搜狗在其中扮演的角色。

现场报道:小兰

(ID:chuangkem) 来源:创客猫

技术的突破带来了文明的进步,从信息文明到智能文明,我们正在经历什么?

在信息文明时代,人和信息之间有很多的维度,其中一个维度是让人能够输出信息,这就是输入法。另一个维度是在互联网上获得信息,大体上最重要的产品是搜索。而这两个维度,搜狗都紧跟信息文明时代的脚步,实现了自己的使命。

在做输入法、搜索的时候,需要跟大量的语言处理打交道,语言是其中的核心,因为人是通过语言进行表达而连接这个世界的。

那在走向真正的智能文明之后,语言的处理还有什么可以改进的地方?这里面的核心词是自然交互、知识计算。

王小川表示,这意味着我们希望跟机器之间用更多人的方式进行交流,比如以前大家用的是五笔输入法,到后来变成拼音,到今天开始用语音。“跟语言相关的大方向里,人其实不是靠敲键去做的,而是靠听觉、视觉进行交流和沟通。”

他指出,这方面大家很容易想到的就是语音识别,但当语音识别变得非常可用时,还有什么东西呢?所以,除了人的表达让机器听懂以外,还要机器表达的时候要用人的方式让人听懂,这里面涉及到声音、图像的合成,让人用听觉和视觉来获得信息。

谈到输入法的未来,王小川认为,仅仅是语音输入是不够的,因为在智能时代,输入法开始不只是一个打字工具,它还可以变成你的助理,极大地提升效率。

另外在搜索方面,他提到,语音搜索还只是解决一个交互自然的问题,事实上今天重大的方向是从搜索走向问答,能把搜索从一个关键词引擎走向一个问答引擎。

最后他表示,“最终我们可以看到这样一个AI能力——以语言为核心,开始具有与人沟通、能听懂、能去说的能力,以及开始处理人的信息和互联网的信息,能开始理解你的概念,做推理,最终变成人的替身,成为个人助理。这是AI时代里面我们可以看到的,从信息文明到智能文明过渡的重点方向。”

以下为王小川演讲实录:

大家好,刚才唐宁(宜信公司创始人、CEO)跟大家讲,未来10年到20年需要有温度、有期待,尤其提到了科技带来的价值。所以今天我讲的主题是信息文明到智能文明的一些思考,尤其是搜狗在里面会扮演什么样的角色。

一次又一次技术的重大突破带来了文明的跃迁,从农业文明到工业文明。随着计算机光纤互联网的发明,我们进入到了信息时代的信息文明。今天往后的两个大方向,一个是用科技来改进人工智能,我们还是认为未来是有智能文明等着我们。当然还有其他很多领域,像生物医药也有重大发展。搜狗之前最成功的产品是搜狗输入法,大家都用得很多,却很少人在想这究竟意味着什么。

80年代末到90年代,当时学电脑、学打字用的是五笔输入法。当时国家领导人也很重视,因为只有中文能够被这个输入法信息化,意味着我们才有机会进入到信息文明。搜狗协助了这样的中国信息化,实现了大家在表达上的突破。人和信息之间有很多的维度,其中一个维度是让人能够输出信息,这就是输入法。另一个维度是在互联网上获得信息,大体上最重要的产品是搜索。所以搜狗在自己定义使命的时候,其实是紧贴着信息文明的时代,让表达和搜索信息更简单,我们也做到了这样的使命。

所以这里有一个核心的关键词——语言。其实在人类历史上,掌握一种语言就掌握了一种灵魂,全球有7000多种语言,只要你对语言深刻的理解,你就理解了一种文化。这个事对计算机是非常有挑战的,在自然语言处理的信息科学里,有一句话叫“自然语言处理是人工智能皇冠上的明珠”,但它很难。当我们做输入法、搜索的时候,要大量地跟语言的处理打交道。

从机器文明向智能文明发展的时候,人工智能技术的突破,像最新的翻译模型的演化,开始把翻译问题变得可解决了。我们让表达和获取信息更简单,不仅可以做到中文,也可以做到跨语言的表达,人和人之间原来通过语言很容易表达,今天通过翻译、同声传译能够大体上让我们听懂。我们跟外国人进行交流的时候,也可以通过跨语言的引擎,我们输入中文,但输出的是外文,或者输入中文查询全球信息获得的是中文,这就使得我们可以做跨语言的输入和搜索。

在这方面,我们发布了新的产品。今天的搜狗搜索里有一个英文搜索频道,其实已经提供了全球搜索,对于英文不好的朋友来说,输入中文能够检索全球的英文信息,包括日韩信息。用中文阅读,搜狗的同传也代表了全球最高水平。搜狗在最近的中网公开赛里面也大展作用,首次在世界型的赛事里亮相,也在发布搜狗翻译机。

所以在信息文明到智慧文明之间的时候,我们在AI上的突破能够起到衔接的作用,看到真正到未来走向智能文明之后,语言的处理还有什么可以改进的地方。人是通过语言进行表达而连接这个世界的。

我们中有两个词:自然交互、知识计算。这意味着我们希望跟机器之间用更多人的方式进行交流,比如以前大家用的是五笔输入法,到后来变成拼音,到今天开始用语音。

从人去适应机器,开始变成机器适应人。以前是机器计算力不足,所以人去记忆编码,然后用语言去做变得更自然,包括用手机,也从以前的键盘用鼠标,走向了触型的,越来越自然。因此跟语言相关的大方向里,人其实不是靠敲键去做的,而是靠听觉、视觉进行交流和沟通。

我们容易想到的方向就是语音识别,现在语音识别已经变得非常可用,但语音识别之外还有什么东西呢?除了人的表达让机器听懂以外,还要机器表达的时候要用人的方式让人听懂。里面涉及到声音、图像的合成,让人用听觉和视觉来获得信息。

我们用了识字分工语料训练的一首曲子----《我的滑板鞋》。在合成之后,我们有一种迁移的技术能把声音叠加,合成我们想要的一首歌,这首歌不是我唱的,而是合成的。这是声音层面。除了声音可以让人听懂以外,我们还有视觉。搜狗有个项目做的是虚拟主播的合成,刚才是一段文字让我听到声音,现在还可以做到,像主播一样给你更加自然的交互。

这个当中的嘴型是通过AI,用语音和图像联合建模,是真实的跟人的嘴型一样,我们内部叫唇语识别。嘴唇运动的时候不用听你的发音,只看嘴型运动,就有80%的准确度能够知道你在说什么。

除了自然交互以外,还有一种领域叫知识计算,它不仅是在语言层面上用语音图像做表达,而是在语言中间进行更抽象的计算。其实语言不像语音图像,它代表了我们对概念的掌握和推理的原点。搜狗做这样的研究,特别大的优势是有场景来使用它们。

谈到输入法的未来是什么,很容易想到语音输入,这个是不够的。去年搜狗上市的时候,当天就收到了3000条祝福的微信,我需要回复,老师、朋友、同学等等。这个时候即便用语音去回复,每个人的回复还不一样,我也会累死掉的。所以在智能的时候,输入法不仅是用语音来输入,而应该让机器产生一定的理解能力,做这样辅助的输入,这样的技术我们其实已经在一些垂直行业开始使用了。

在今年的Google IO大会上有类似的辅助人进行表达和对话的能力。这代表我们在往智能时代走,输入法开始不只是一个打字工具,它会变成你的助理。不只是让你做一道填空题,而是把填空题变成选择题,来理解你的个性,帮助你做这样的设计,最后你做选择。这样能极大地提升效率,特别是在客服、销售的这些领域里,能够把企业文化和他们的术语用到个人表达里提高工作效率。

另外,搜索到智能时代之后会有什么变化。去年我们在路演的时候大家也提到,那是不是叫做语音搜索,语音搜索还只是解决一个交互自然的问题,事实上今天重大的方向是从搜索走向问答。我们以前习惯用一个关键词进去,给你10条结果,这是不自然的过程,这是人被迫适应机器不智能时候的一种方式。

今天更多的研究是在于,怎么当你说一句话的时候,机器理解你的提问,以及这个机器在阅读互联网上千亿页面的时候,在页面中间产生阅读能力来寻找答案,能把搜索从一个关键词引擎走向一个问答引擎。

在这个里面,我们已经做出一些实用的产品来。去年我们在《一站到底》的比赛当中已经开始使用了我们的机器,它的真实性在今年的直播答题比赛里面也都有使用。目前搜狗搜索已经能做到大概20%用户的提问搜索直接给答案,而不是给10条的结果了,这也是今天搜索行业里面在努力的方向。国际关于问答领域的研究现在也成为人工智能中语言方向最重要的一支。从一个信息文明向智能文明过渡的时候,我们让机器开始帮助人更好地进行沟通,我们称为自然交互,帮助建立智能,开始做知识的计算。

所以在这种情况下,最终我们可以看到这样一个AI能力——以语言为核心,开始具有与人沟通、能听懂、能去说的能力,以及开始处理人的信息和互联网的信息,能开始理解你的概念,做推理,最终变成人的替身,成为个人助理,这在行业当中叫VPA(虚拟个人助理)。这个是AI时代里面我们可以看到的,从信息文明到智能文明过渡的重点方向,这也是搜狗努力的方向,我们有很好的技术能力和使用场景来支持这样业务的发展。

这是我今天给大家做的分享,谢谢!

以上为创客猫现场报道,转载请注明来源

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181029A1VBNI00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券