搜狗CEO王小川AI如何帮助我们用语言连接世界

10 月 27 日, 由《麻省理工科技评论》、DeepTech 深科技联合主办, 梅赛德斯-奔驰特别呈现的“全球科技青年论坛” 在北京举行。论坛集结了海内外 30 余名顶尖科学家、企业家与研究者, 为现场超过 600 名关注新兴科技、热爱科学事业的参会者开启了接触前沿领域专家的机会。 搜狗 CEO 王小川在会上发表了演讲, 探讨了信息文明时代下的人与信息的关系, 同时分享了搜狗在这方面的 AI 技术创新和应用。

图丨王小川(来源:DT君) DT 君就王小川在论坛中的精彩演讲进行整理, 内容略有删改: 今天我讲的主题是信息文明到智能文明的一些思考, 尤其是搜狗在其中会扮演什么样的角色。 一次又一次技术的重大突破带来了文明的跃迁, 从农业文明到工业文明。随着计算机、光纤、互联网的发明, 我们进入到了信息时代的信息文明。 80 年代末到 90 年代, 我们非常重视电脑打字和输入法, 因为只有中文能够被这个输入法信息化, 我们才有机会进入到信息文明。搜狗协助了这样的中国信息化, 实现了大家表达的突破。 人和信息之间的关系有很多的维度, 其中一个是让人能够输出信息, 这就是输入法。另一个维度是在互联网上获得信息, 这方面最重要的产品就是搜索。所以搜狗在自己定义使命的时候, 其实紧贴着信息文明的时代, 让表达和搜索信息更简单。

图丨王小川(来源:DT君) 这里有一个核心就是语言。其实在人类历史上, 掌握一种语言就掌握了一种灵魂, 全球有 7000 多种语言, 只要你对语言有深刻的理解, 你就理解了一种文化。而语言对计算机来说是非常有挑战的, 在自然语言处理的信息科学里, 有一句话叫“自然语言处理是人工智能皇冠上的明珠”, 但它很难。当我们做输入法、搜索的时候, 也需要大量地跟语言的处理打交道。 从机器文明向智能文明发展的时候, 人工智能技术的突破, 例如最新的翻译模型的演化, 开始把翻译问题变得可解决。我们让表达和信息获取变得更简单, 不仅可以做到中文, 还可以做到跨语言的表达。我们也可以使用跨语言的引擎, 输入中文, 输出的是外文, 或者输入中文查询全球信息, 这就使得我们可以做跨语言的输入和搜索。 而在信息文明到智慧文明之间, 我们在 AI 上的突破能够起到衔接的作用, 未来走向智能文明之后, 人是需要通过语言进行表达而连接这个世界的。 这里有两个词:自然交互、知识计算。这意味着我们希望以人的方式与机器交流。我们从人去适应机器, 开始变成机器适应人。以前机器计算力不足, 所以人需要去记忆编码, 用了语言后这个过程就变得更加自然了。如今的手机也从以前的键盘鼠标走向了触屏, 也变得越来越自然。因此在这个和语言相关的大方向里, 人其实不是靠敲键去做的, 而是靠听觉、视觉进行交流和沟通。 我们容易想到的方向就是语音识别, 现在语音识别已经变得非常可用, 但语音识别之外还有什么东西呢?除了让机器听懂人的表达之外, 还要能以人能听懂的方式进行表达, 里面涉及到声音、图像的合成, 让人用听觉和视觉来获得信息。 而除了自然交互以外, 还有一种领域叫知识计算, 它不仅是在语言层面上通过语音图像进行表达, 而是要在语言中间进行更抽象的计算。其实语言不像语音图像, 它代表了我们对概念的掌握和推理。搜狗做这样的研究, 特别大的优势是有场景来使用它们。

图丨王小川(来源:DT君) 谈到输入法的未来, 我们很容易想到语音输入, 但这个是不够的。去年搜狗上市的时候, 当天就收到了 3000 条祝福信息, 这让人很难一一回复, 因此也许真正智能的输入法不仅是用语音来输入, 而应该让机器产生一定的理解能力, 做辅助性的输入, 这样的技术我们已经开始运用在一些较为垂直领域了。 谷歌曾在 I/O 开发者大会上展示过辅助人进行表达和对话的语音助手。这种辅助人进行表达和对话, 意味着输入法不再只是一个打字工具, 它会变成你的助理, 不只是让你做一道填空题, 而是把填空题变成选择题, 来理解你的个性, 最后你做选择。这样能极大地提升效率, 特别是在客服、销售的这些领域里, 能够把企业文化和他们的术语用到个人表达里提高工作效率。

图丨王小川(来源:DT君) 另外, 搜索到智能时代之后会有什么变化呢?我们现在说到的语音搜索其实还只是解决一个交互自然的问题, 而事实上, 目前搜索的重大发展方向是从搜索走向问答, 我们以前习惯于搜索一个关键词, 得到 10 条结果, 但这是不自然的过程, 这是人被迫适应机器不智能时候的一种方式。 今天更多的研究是在于, 如何在你说一句话的时候, 机器就能理解你的提问, 同时这个机器在阅读网上数千个页面的时候, 在页面中间产生阅读能力来寻找答案, 从而把搜索从一个关键词引擎走向一个问答引擎。 在这个里面, 我们已经做出一些实用的产品来。目前搜狗搜索已经能做到大概 20% 用户的提问搜索直接给出答案, 而不是给 10 条的结果了, 这也是今天搜索行业正在努力的方向。 在国际上, 关于问答领域的研究也成为了人工智能中语言方向的重要研究之一。从一个信息文明向智能文明过渡的时候, 我们让机器开始帮助人更好地进行沟通, 我们称为自然交互, 帮助建立智能, 并开始做知识的计算。 所以在这种情况下, 最终我们可以看到这样一个 AI 能力:以语言为核心, 开始具有与人沟通、能听懂、会表达的能力, 以及开始处理人的信息和互联网的信息, 能开始理解你的概念, 做推理, 成为个人助理, 这在行业当中叫 VPA(虚拟个人助理)。 这就是 AI 时代里面, 从信息文明到智能文明过渡的重点方向, 这也是搜狗努力的方向, 我们有很好的技术能力和使用场景来支持这种业务的发展。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181101A1Q5UT00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券