chat bot(聊天机器人)解密

最近百度组织架构调整一则消息,值得关注:度秘升级为事业部,由原微软小冰创造者之一的景鲲担任总经理,直接向CEO陆奇汇报。

事实上,2017 年度秘已经占据了不少新闻版面。比如在 2017 CES 上,由度秘研发的 DuerOS 正式亮相,这是一个基于语音交互的新一代人工智能操作系统,同时还联合小鱼在家一起推出了个人助理机器人,该产品也被 CNN 评为 2017 CES 上 14 项最酷产品之一。此次升级度秘事业部,也彰显出度秘、DuerOS在百度整个人工智能布局里的重要地位。

一、度秘是什么?

度秘(英文名:Duer)是百度出品的对话式人工智能秘书,在2015年9月由李彦宏(Robin)在百度世界大会中推出。通过语音识别、自然语言处理和机器学习技术,用户可以使用语音、文字或图片,以一对一的形式与度秘进行沟通。

度秘可以在对话中清晰的理解用户的多种需求,进而在广泛索引真实世界的服务和信息的基础上,为用户提供各种优质服务。比如一键叫车、订个喜欢吃的外卖、买张熟悉位置的电影票、预定心仪的餐厅,还有智能化叫醒起床等。跟其他的萌宠网络机器人不同,度秘的定位是专业、实用、优质的体验。

度秘的产品能力:

度秘涉及的技术:

二、核心关键技术是:语音识别,多轮对话,语义搜索。分别讲一讲:

1、语音识别技术。当前都比较成熟了,主要是特别是2009年以来,借助机器学习领域深度学习研究的发展,以及大数据语料的积累,语音识别技术得到突飞猛进的发展。微软的研究员2009年注意到,此前人们在训练神经网络识别语音时忽略了一个重要问题——协同发音(Coarticulation)建模。将这种简单的方法与DNN结合,一下就产生了飞跃。有意思的是,如果将这种方法应用于非DNN,效果并不特别明显,若单纯使用DNN,也无法取得如此惊人的突破。看着错误率比之前的方法一路降低至32%,这个32%识别率的改善于2011年秋季在意大利佛罗伦萨的Interspeech语音国际会议上发表,对语音研究界起了极大的冲击。从此以后,世界各地语音识别的研究与开发都开始了DNN尝试。

2、多轮对话技术。我们在日常生活中经常使用自然语言对话系统,比如苹果Siri。现在的对话系统多数只能做单轮对话,可以帮助用户完成一些简单的任务,如问天气,查股票(如果做多轮对话,也是在单轮对话的基础上加一些简单处理)。实现这些自然语言对话系统的基本技术可以分为两大类,基于规则的和基于数据的。

如果做多轮对话,也是在单轮对话的基础上做一些简单的处理。技术主要包括基于手写规则的,和基于数据驱动的。比如,六十年代就有著名的Eliza系统问世,基于手写规则,能与用户进行简单的对话,使许多用户感觉到好像是在跟真人进行交流。Siri之后,有许多对话产品出现,包括谷歌Now,微软Cortana。国内有许多聊天机器人发布,如微软小冰,受到广泛瞩目。据我们所知,大部分的对话系统都是基于规则,或者基于数据的。

自然语言对话的研究与开发,虽然取得了一定的进展,但离实现人工智能的理想,甚至离实现在复杂场景下的实用化还有很大距离。自然语言对话有许多应用场景。比如,如果用户能够通过对话在智能手机上完成订酒店之类的复杂任务,那么手机就会真正成为用户的得力助手。这里的核心问题是如何“理解”用户的语言,帮助用户完成任务。现在的语音助手还不能做到这一点。再比如,许多公司有呼叫中心,在电话上回答用户提出的各种问题。如果能够实现自动呼叫中心,机器来回答用户的问题,就能大大提高服务的效率和质量。这里的核心问题也是自然语言对话。

3、语义搜索技术。通过语音识别和多轮对话,获取了用户的意图,接下来就是返回用户所需要的东西。语义搜索简单的说就是让机器、软件理解人类语言获取真正希望的信息。这里面的概念就很多了,知识图谱,语义网络,实体搜索。讲一讲实体搜索,实体搜索是语义搜索的一种典型实现。

实体(entity)搜索是相对于关键词(keyword)搜索而言的,传统的关键词搜索虽然目前已经可以达到很高的"智能"水平, 搜索结果在很大程度上可以帮助用户找到需要的信息,但对于"搜索引擎"这个系统自身而言, 其实并不了解搜索query本身有什么意思, 对于搜索"盗梦空间"和"喵喵喵", 搜索引擎做的事情基本差不多. 你告诉他要找什么, 他就去按照字面意思勤勤恳恳的去找. 搜索引擎无法直接回答query, 只能做一个信息的中转。实体搜索关注的重点不是"关键词"级别的信息,而是"对象", 比如: 人, 电影, 软件, 小说, 公司, 组织等等. 从关键词向实体转化, 希望可以从更精细的角度来理解和组织搜索结果. 在一定程度上可以理解query的意思,并给出自己的答案。一些更智能更个性化的交互也依赖于实体作为基础, 比如搜索"好看的电影",直接返回用户期望的电影。

原文发布于微信公众号 - 大数据和云计算技术(jiezhu2007)

原文发表时间:2017-02-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏华章科技

揭秘微信用户行为习惯,用户究竟爱看什么?

只有深度了解用户的习惯和行为,才能做出最火的内容;用户为何选择分享某些信息,又为何对某些信息视而不见,了解这些有助于在注意力的竞争中占尽先机。

49810
来自专栏镁客网

比人类更强大的不是人工智能,而是掌握了人工智能的人类 | 科大讯飞年度发布会重磅发布三大板块、十项产品

17700
来自专栏CDA数据分析师

为什么你学完了68个Python函数,却依旧做不好数据分析?

? 作者 Gam 本文为CDA数据分析师原创作品,转载需授权 数据分析老鸟都知道,相比于自己作出好的数据分析报告,“教别人如何入门数据分析”这事情简单多了...

38370
来自专栏WeTest质量开放平台团队的专栏

游戏人工智能 读书笔记 (三) 游戏和人工智能的相互影响

原文链接:https://wetest.qq.com/lab/view/412.html

19820
来自专栏新智元

MIT教授称人类大脑并不比AI复杂,30年内机器智能将可复制爱与同情

【新智元导读】不久前,由IBM研发的AI辩论系统Project Dabater与人类辩论冠军进行了一场辩论,AI的表现令人印象深刻。从Project Debat...

10660
来自专栏鹅厂优文

游戏人工智能 读书笔记 (三) 游戏和人工智能的相互影响

Chapter 1.3 Why Games for Artificial Intelligence

27470
来自专栏云计算D1net

云计算成本:4个神话与误解

如今,企业将业务迁移到云端的趋势很普遍,这样做会为企业CIO及其组织节省成本。当然,企业可以通过将某些工作负载迁移到云计算环境来节省资金。然而,这一误解产生于可...

17520
来自专栏大数据挖掘DT机器学习

研究生:数据分析/挖掘工作的疑惑?

数据分析/挖掘工作的疑惑 本人在读硕士一名,研二,理工科,所作工作于这两方面无关。但是,最近对这个方向特别感兴趣,真的很想从事这方面的工作。目前,正在自学中,以...

50350
来自专栏大数据文摘

跨界,圈外人该如何闯入数据科学家的世界?

21360
来自专栏PPV课数据科学社区

推荐 :如何才能获得一份数据科学家的职位

作者Alec Smith是数据科学领域中资深HR,之所以写这篇文章是因为经常被问到一个问题:“如何才能获得一份数据科学家的职位?” 不仅这个问题经常被问引起了注...

35950

扫码关注云+社区

领取腾讯云代金券