chat bot(聊天机器人)解密

最近百度组织架构调整一则消息,值得关注:度秘升级为事业部,由原微软小冰创造者之一的景鲲担任总经理,直接向CEO陆奇汇报。

事实上,2017 年度秘已经占据了不少新闻版面。比如在 2017 CES 上,由度秘研发的 DuerOS 正式亮相,这是一个基于语音交互的新一代人工智能操作系统,同时还联合小鱼在家一起推出了个人助理机器人,该产品也被 CNN 评为 2017 CES 上 14 项最酷产品之一。此次升级度秘事业部,也彰显出度秘、DuerOS在百度整个人工智能布局里的重要地位。

一、度秘是什么?

度秘(英文名:Duer)是百度出品的对话式人工智能秘书,在2015年9月由李彦宏(Robin)在百度世界大会中推出。通过语音识别、自然语言处理和机器学习技术,用户可以使用语音、文字或图片,以一对一的形式与度秘进行沟通。

度秘可以在对话中清晰的理解用户的多种需求,进而在广泛索引真实世界的服务和信息的基础上,为用户提供各种优质服务。比如一键叫车、订个喜欢吃的外卖、买张熟悉位置的电影票、预定心仪的餐厅,还有智能化叫醒起床等。跟其他的萌宠网络机器人不同,度秘的定位是专业、实用、优质的体验。

度秘的产品能力:

度秘涉及的技术:

二、核心关键技术是:语音识别,多轮对话,语义搜索。分别讲一讲:

1、语音识别技术。当前都比较成熟了,主要是特别是2009年以来,借助机器学习领域深度学习研究的发展,以及大数据语料的积累,语音识别技术得到突飞猛进的发展。微软的研究员2009年注意到,此前人们在训练神经网络识别语音时忽略了一个重要问题——协同发音(Coarticulation)建模。将这种简单的方法与DNN结合,一下就产生了飞跃。有意思的是,如果将这种方法应用于非DNN,效果并不特别明显,若单纯使用DNN,也无法取得如此惊人的突破。看着错误率比之前的方法一路降低至32%,这个32%识别率的改善于2011年秋季在意大利佛罗伦萨的Interspeech语音国际会议上发表,对语音研究界起了极大的冲击。从此以后,世界各地语音识别的研究与开发都开始了DNN尝试。

2、多轮对话技术。我们在日常生活中经常使用自然语言对话系统,比如苹果Siri。现在的对话系统多数只能做单轮对话,可以帮助用户完成一些简单的任务,如问天气,查股票(如果做多轮对话,也是在单轮对话的基础上加一些简单处理)。实现这些自然语言对话系统的基本技术可以分为两大类,基于规则的和基于数据的。

如果做多轮对话,也是在单轮对话的基础上做一些简单的处理。技术主要包括基于手写规则的,和基于数据驱动的。比如,六十年代就有著名的Eliza系统问世,基于手写规则,能与用户进行简单的对话,使许多用户感觉到好像是在跟真人进行交流。Siri之后,有许多对话产品出现,包括谷歌Now,微软Cortana。国内有许多聊天机器人发布,如微软小冰,受到广泛瞩目。据我们所知,大部分的对话系统都是基于规则,或者基于数据的。

自然语言对话的研究与开发,虽然取得了一定的进展,但离实现人工智能的理想,甚至离实现在复杂场景下的实用化还有很大距离。自然语言对话有许多应用场景。比如,如果用户能够通过对话在智能手机上完成订酒店之类的复杂任务,那么手机就会真正成为用户的得力助手。这里的核心问题是如何“理解”用户的语言,帮助用户完成任务。现在的语音助手还不能做到这一点。再比如,许多公司有呼叫中心,在电话上回答用户提出的各种问题。如果能够实现自动呼叫中心,机器来回答用户的问题,就能大大提高服务的效率和质量。这里的核心问题也是自然语言对话。

3、语义搜索技术。通过语音识别和多轮对话,获取了用户的意图,接下来就是返回用户所需要的东西。语义搜索简单的说就是让机器、软件理解人类语言获取真正希望的信息。这里面的概念就很多了,知识图谱,语义网络,实体搜索。讲一讲实体搜索,实体搜索是语义搜索的一种典型实现。

实体(entity)搜索是相对于关键词(keyword)搜索而言的,传统的关键词搜索虽然目前已经可以达到很高的"智能"水平, 搜索结果在很大程度上可以帮助用户找到需要的信息,但对于"搜索引擎"这个系统自身而言, 其实并不了解搜索query本身有什么意思, 对于搜索"盗梦空间"和"喵喵喵", 搜索引擎做的事情基本差不多. 你告诉他要找什么, 他就去按照字面意思勤勤恳恳的去找. 搜索引擎无法直接回答query, 只能做一个信息的中转。实体搜索关注的重点不是"关键词"级别的信息,而是"对象", 比如: 人, 电影, 软件, 小说, 公司, 组织等等. 从关键词向实体转化, 希望可以从更精细的角度来理解和组织搜索结果. 在一定程度上可以理解query的意思,并给出自己的答案。一些更智能更个性化的交互也依赖于实体作为基础, 比如搜索"好看的电影",直接返回用户期望的电影。

原文发布于微信公众号 - 大数据和云计算技术(jiezhu2007)

原文发表时间:2017-02-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器人网

别小瞧机器人,它们可能比你更遵守交通规则

机器人技术不断发展,机器人越来越内建各种智能设备,我们已经看到像“Roomba 980”这样的机器人设备,从其前身随机和碰撞容易的导航过渡到光学映射导航,以识别...

3187
来自专栏数据猿

HCR(慧辰资讯)大数据产品部总监黄鸣:基于运营商“行业洞察”标签的传统企业掘金之路

<数据猿导读> HCR大数据产品部总监黄鸣在2016年中国信息通信大数据上发表了以“基于运营商“行业洞察”标签的传统企业掘金之路”为主题的演讲。黄鸣提到,在5年...

3124
来自专栏ATYUN订阅号

赫尔辛基大学AI基础教程:关于预测未来(6.1节)

说些你可能会感到失望的话,我们不是巫师,不会有一个水晶球可以向我们展示未来世界会是什么样子,以及AI如何改变我们的生活。

1114
来自专栏钱塘大数据

人工智能步入金融领域,“AI+”会是金融业的未来吗

目前金融机构的主流玩法有四种:1. 投资银行和卖方研究尝试自动报告生成,2. 金融智能搜索;3. 公募、私募基金在通过人工智能辅助量化交易;4. 财富管理公司在...

3535
来自专栏ATYUN订阅号

MIT将个性化深度学习网络应用于机器人,让AI更有效地评估和治疗自闭症儿童

麻省理工学院媒体实验室的研究人员现在开发了一种个性化的机器学习,帮助机器人使用自闭症儿童独有的数据来评估这些互动过程中,每个孩子的参与度和兴趣。

1315
来自专栏CDA数据分析师

鲍忠铁:深度商业分析的7大基石

本文为TalkingData首席金融行业专家在CDAS2016大数据金融分论坛上的分享,已经过嘉宾审核,整理出来,以飨读者。 今天跟大家分享三方面的内容,一个是...

1866
来自专栏BestSDK

李开复:人工智能威胁论目前就当小说看看吧

  “我”算是人工智能领域的“先烈”了,较早进入这个行业。三四年前当“我”申请博士所写的文章里就提到了我对AI的看法:“最终会让人类找到自己”,但是毕竟当时人工...

32512
来自专栏AI科技评论

卡耐基梅隆邢波眼里的人工智能:它的价值在于通用性

GAIR 今年夏天,雷锋网将在深圳举办一场盛况空前的“全球人工智能与机器人创新大会”(简称GAIR)。大会现场,雷锋网将发布“人工智能&机器人Top25创新企...

3635
来自专栏大数据文摘

量邦科技冯永昌:AI让量化投资的战争升级,交易面或许不改变其零和博弈的性质|人工智能研习社

1333
来自专栏华章科技

大数据不背“杀熟”的锅!高科技公司掌握了你的个人信息,都干了些啥?

首先大家对于“大数据杀熟”这件事怎么理解?“杀熟”是客户营销方面的标准操作吗?高科技公司掌握了我们的个人信息,难道只能用于诱骗客户进行过度消费吗?

602

扫码关注云+社区