chat bot(聊天机器人)解密

最近百度组织架构调整一则消息,值得关注:度秘升级为事业部,由原微软小冰创造者之一的景鲲担任总经理,直接向CEO陆奇汇报。

事实上,2017 年度秘已经占据了不少新闻版面。比如在 2017 CES 上,由度秘研发的 DuerOS 正式亮相,这是一个基于语音交互的新一代人工智能操作系统,同时还联合小鱼在家一起推出了个人助理机器人,该产品也被 CNN 评为 2017 CES 上 14 项最酷产品之一。此次升级度秘事业部,也彰显出度秘、DuerOS在百度整个人工智能布局里的重要地位。

一、度秘是什么?

度秘(英文名:Duer)是百度出品的对话式人工智能秘书,在2015年9月由李彦宏(Robin)在百度世界大会中推出。通过语音识别、自然语言处理和机器学习技术,用户可以使用语音、文字或图片,以一对一的形式与度秘进行沟通。

度秘可以在对话中清晰的理解用户的多种需求,进而在广泛索引真实世界的服务和信息的基础上,为用户提供各种优质服务。比如一键叫车、订个喜欢吃的外卖、买张熟悉位置的电影票、预定心仪的餐厅,还有智能化叫醒起床等。跟其他的萌宠网络机器人不同,度秘的定位是专业、实用、优质的体验。

度秘的产品能力:

度秘涉及的技术:

二、核心关键技术是:语音识别,多轮对话,语义搜索。分别讲一讲:

1、语音识别技术。当前都比较成熟了,主要是特别是2009年以来,借助机器学习领域深度学习研究的发展,以及大数据语料的积累,语音识别技术得到突飞猛进的发展。微软的研究员2009年注意到,此前人们在训练神经网络识别语音时忽略了一个重要问题——协同发音(Coarticulation)建模。将这种简单的方法与DNN结合,一下就产生了飞跃。有意思的是,如果将这种方法应用于非DNN,效果并不特别明显,若单纯使用DNN,也无法取得如此惊人的突破。看着错误率比之前的方法一路降低至32%,这个32%识别率的改善于2011年秋季在意大利佛罗伦萨的Interspeech语音国际会议上发表,对语音研究界起了极大的冲击。从此以后,世界各地语音识别的研究与开发都开始了DNN尝试。

2、多轮对话技术。我们在日常生活中经常使用自然语言对话系统,比如苹果Siri。现在的对话系统多数只能做单轮对话,可以帮助用户完成一些简单的任务,如问天气,查股票(如果做多轮对话,也是在单轮对话的基础上加一些简单处理)。实现这些自然语言对话系统的基本技术可以分为两大类,基于规则的和基于数据的。

如果做多轮对话,也是在单轮对话的基础上做一些简单的处理。技术主要包括基于手写规则的,和基于数据驱动的。比如,六十年代就有著名的Eliza系统问世,基于手写规则,能与用户进行简单的对话,使许多用户感觉到好像是在跟真人进行交流。Siri之后,有许多对话产品出现,包括谷歌Now,微软Cortana。国内有许多聊天机器人发布,如微软小冰,受到广泛瞩目。据我们所知,大部分的对话系统都是基于规则,或者基于数据的。

自然语言对话的研究与开发,虽然取得了一定的进展,但离实现人工智能的理想,甚至离实现在复杂场景下的实用化还有很大距离。自然语言对话有许多应用场景。比如,如果用户能够通过对话在智能手机上完成订酒店之类的复杂任务,那么手机就会真正成为用户的得力助手。这里的核心问题是如何“理解”用户的语言,帮助用户完成任务。现在的语音助手还不能做到这一点。再比如,许多公司有呼叫中心,在电话上回答用户提出的各种问题。如果能够实现自动呼叫中心,机器来回答用户的问题,就能大大提高服务的效率和质量。这里的核心问题也是自然语言对话。

3、语义搜索技术。通过语音识别和多轮对话,获取了用户的意图,接下来就是返回用户所需要的东西。语义搜索简单的说就是让机器、软件理解人类语言获取真正希望的信息。这里面的概念就很多了,知识图谱,语义网络,实体搜索。讲一讲实体搜索,实体搜索是语义搜索的一种典型实现。

实体(entity)搜索是相对于关键词(keyword)搜索而言的,传统的关键词搜索虽然目前已经可以达到很高的"智能"水平, 搜索结果在很大程度上可以帮助用户找到需要的信息,但对于"搜索引擎"这个系统自身而言, 其实并不了解搜索query本身有什么意思, 对于搜索"盗梦空间"和"喵喵喵", 搜索引擎做的事情基本差不多. 你告诉他要找什么, 他就去按照字面意思勤勤恳恳的去找. 搜索引擎无法直接回答query, 只能做一个信息的中转。实体搜索关注的重点不是"关键词"级别的信息,而是"对象", 比如: 人, 电影, 软件, 小说, 公司, 组织等等. 从关键词向实体转化, 希望可以从更精细的角度来理解和组织搜索结果. 在一定程度上可以理解query的意思,并给出自己的答案。一些更智能更个性化的交互也依赖于实体作为基础, 比如搜索"好看的电影",直接返回用户期望的电影。

原文发布于微信公众号 - 大数据和云计算技术(jiezhu2007)

原文发表时间:2017-02-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏程序员笔记

藏在游戏外表之下的

1654
来自专栏CDA数据分析师

什么样的VR企业才能活到最后?

VR,是一种传说,一种带有未来感的概念,还是一场正在发生或者已经发生的深刻变革? 不管你过去怎么看VR,在4月16日经管之家商学院VR体验沙龙上,你可能会对VR...

1819
来自专栏CDA数据分析师

用数据说话,Python是不是越来越火了?

Python 是不是越来越火了?答案是肯定的。 在这个问题下(为什么 Python 现在越来越火了?),很多答主轻描淡写的说,题主感觉 Python 火了是因...

1668
来自专栏科技向令说

响铃:AI技术赋能,智能微投能靠用户体验迎来爆发吗?

智能微投就是如此,虽然已经默默地有了长足的发展,但这个2015年启动的智能硬件产品类型一直游离在互联网的边缘。从取代电视的窠臼里跳出,智能微投一直在试图用更合适...

572
来自专栏产品成长日志

从《时间的朋友2017》中收获的16个新认知:市场篇、用户篇、成长篇

2017年12月31日晚上看了罗胖的《时间的朋友2017》,随后又听了2遍音频,真的很佩服罗胖的演讲能力,而且给我的感觉是罗胖比前两年跨年演讲表现的更好了,整场...

451
来自专栏AI科技评论

大会 | AITech 次日,脑科学、智能外科、多模态智能等多个话题引热议

AI 科技评论按,3 月 30 日,AITech(2018 国际智能科技峰会) 于深圳隆重召开。本次峰会由深圳市人民政府指导,深圳市龙岗区人民政府、中关村视听产...

1106
来自专栏量子位

想打造一个不智障的聊天机器人?这里有六条实战指南

李杉 编译整理 量子位 出品 | 公众号 QbitAI ? 苹果推出Siri已经7年,杰夫·贝索斯(Jeff Bezos)受到《星际迷航》的启发推出Alexa也...

3005
来自专栏镁客网

「人物特写」电子科技大学陈建文:没有完美的大数据,现实世界都是小数据

670
来自专栏CSDN技术头条

代码将退出历史舞台:像训狗一样训练计算机

计算机尚未出现之前,大多数经验丰富的心理学家都以为大脑就像个不可知的黑匣子。我们可以分析对象的行为——比如著名的巴普洛夫实验:摇响铃铛会让狗分泌唾液,但思维、记...

2028
来自专栏镁客网

中国“芯”时代未至,何谈“互联网+”?

1895

扫描关注云+社区