前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >chat bot(聊天机器人)解密

chat bot(聊天机器人)解密

作者头像
大数据和云计算技术
发布2018-03-08 15:35:29
1.8K0
发布2018-03-08 15:35:29
举报

最近百度组织架构调整一则消息,值得关注:度秘升级为事业部,由原微软小冰创造者之一的景鲲担任总经理,直接向CEO陆奇汇报。

事实上,2017 年度秘已经占据了不少新闻版面。比如在 2017 CES 上,由度秘研发的 DuerOS 正式亮相,这是一个基于语音交互的新一代人工智能操作系统,同时还联合小鱼在家一起推出了个人助理机器人,该产品也被 CNN 评为 2017 CES 上 14 项最酷产品之一。此次升级度秘事业部,也彰显出度秘、DuerOS在百度整个人工智能布局里的重要地位。

一、度秘是什么?

度秘(英文名:Duer)是百度出品的对话式人工智能秘书,在2015年9月由李彦宏(Robin)在百度世界大会中推出。通过语音识别、自然语言处理和机器学习技术,用户可以使用语音、文字或图片,以一对一的形式与度秘进行沟通。

度秘可以在对话中清晰的理解用户的多种需求,进而在广泛索引真实世界的服务和信息的基础上,为用户提供各种优质服务。比如一键叫车、订个喜欢吃的外卖、买张熟悉位置的电影票、预定心仪的餐厅,还有智能化叫醒起床等。跟其他的萌宠网络机器人不同,度秘的定位是专业、实用、优质的体验。

度秘的产品能力:

度秘涉及的技术:

二、核心关键技术是:语音识别,多轮对话,语义搜索。分别讲一讲:

1、语音识别技术。当前都比较成熟了,主要是特别是2009年以来,借助机器学习领域深度学习研究的发展,以及大数据语料的积累,语音识别技术得到突飞猛进的发展。微软的研究员2009年注意到,此前人们在训练神经网络识别语音时忽略了一个重要问题——协同发音(Coarticulation)建模。将这种简单的方法与DNN结合,一下就产生了飞跃。有意思的是,如果将这种方法应用于非DNN,效果并不特别明显,若单纯使用DNN,也无法取得如此惊人的突破。看着错误率比之前的方法一路降低至32%,这个32%识别率的改善于2011年秋季在意大利佛罗伦萨的Interspeech语音国际会议上发表,对语音研究界起了极大的冲击。从此以后,世界各地语音识别的研究与开发都开始了DNN尝试。

2、多轮对话技术。我们在日常生活中经常使用自然语言对话系统,比如苹果Siri。现在的对话系统多数只能做单轮对话,可以帮助用户完成一些简单的任务,如问天气,查股票(如果做多轮对话,也是在单轮对话的基础上加一些简单处理)。实现这些自然语言对话系统的基本技术可以分为两大类,基于规则的和基于数据的。

如果做多轮对话,也是在单轮对话的基础上做一些简单的处理。技术主要包括基于手写规则的,和基于数据驱动的。比如,六十年代就有著名的Eliza系统问世,基于手写规则,能与用户进行简单的对话,使许多用户感觉到好像是在跟真人进行交流。Siri之后,有许多对话产品出现,包括谷歌Now,微软Cortana。国内有许多聊天机器人发布,如微软小冰,受到广泛瞩目。据我们所知,大部分的对话系统都是基于规则,或者基于数据的。

自然语言对话的研究与开发,虽然取得了一定的进展,但离实现人工智能的理想,甚至离实现在复杂场景下的实用化还有很大距离。自然语言对话有许多应用场景。比如,如果用户能够通过对话在智能手机上完成订酒店之类的复杂任务,那么手机就会真正成为用户的得力助手。这里的核心问题是如何“理解”用户的语言,帮助用户完成任务。现在的语音助手还不能做到这一点。再比如,许多公司有呼叫中心,在电话上回答用户提出的各种问题。如果能够实现自动呼叫中心,机器来回答用户的问题,就能大大提高服务的效率和质量。这里的核心问题也是自然语言对话。

3、语义搜索技术。通过语音识别和多轮对话,获取了用户的意图,接下来就是返回用户所需要的东西。语义搜索简单的说就是让机器、软件理解人类语言获取真正希望的信息。这里面的概念就很多了,知识图谱,语义网络,实体搜索。讲一讲实体搜索,实体搜索是语义搜索的一种典型实现。

实体(entity)搜索是相对于关键词(keyword)搜索而言的,传统的关键词搜索虽然目前已经可以达到很高的"智能"水平, 搜索结果在很大程度上可以帮助用户找到需要的信息,但对于"搜索引擎"这个系统自身而言, 其实并不了解搜索query本身有什么意思, 对于搜索"盗梦空间"和"喵喵喵", 搜索引擎做的事情基本差不多. 你告诉他要找什么, 他就去按照字面意思勤勤恳恳的去找. 搜索引擎无法直接回答query, 只能做一个信息的中转。实体搜索关注的重点不是"关键词"级别的信息,而是"对象", 比如: 人, 电影, 软件, 小说, 公司, 组织等等. 从关键词向实体转化, 希望可以从更精细的角度来理解和组织搜索结果. 在一定程度上可以理解query的意思,并给出自己的答案。一些更智能更个性化的交互也依赖于实体作为基础, 比如搜索"好看的电影",直接返回用户期望的电影。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-02-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据和云计算技术 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档