首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

自然语言对话发展机遇|数据堂

自然语言对话系统的研究与开发从人工智能早期就已开始。从ELIZA到SHRDLU,从Siri到Alexa,对话系统伴随着语言与语音技术的进步不断地发展与演进(见表1)。当前自然语言对话技术作为人机交互的重要手段,已经可以用到许多领域和场景中,各种对话系统,包括手机、电视、车载的语音助手、智能音箱、自动客服、聊天机器人,已经进入我们生活和工作的方方面面,而且随着技术的发展,将会被更广泛地使用 。

对话技术在过去几十年里的进步有多大?要找到这个问题的答案,可以观看1992年美国电视节目《早安美国》(Good Morning America)的一个报道(Youtube上有该节目的视频)。节目中当时在苹果公司任职的李开复演示了苹果公司开发的语音对话系统Casper。当时最先进的Casper也只能“理解”一些简单的命令,语音识别的准确率不到90%。相比之下,现在的语音对话系统一般可以“理解”更多更复杂的语音,识别的准确率也超过95%。

编辑搜图

请点击输入图片描述(最多18字)

▌应用与技术的现状 ▌

自然语言对话系统分为语音对话系统与文字对话系统,有C端(面向消费者)应用和B端(面向企业)应用。C端语音对话系统主要有手机、电视、车载的语音助手、智能音箱等。

据国内市场调查,在使用语音对话系统的用户中,有33%的用户每天使用,42%的用户每周使用3~4次,16%的用户每周使用一次。据专业人士估计,手机、车载、电视、智能音箱的语音对话系统日使用率分别为5%、45%、30%、25%。

用户对语音对话系统的使用频度还是比较高的,只要开始使用就能在一定程度上持续使用。语音对话系统的种类主要集中在车载和家居(电视和智能音箱)场景,主要原因是这些场景更加便于使用语音对话。语音对话系统能够帮助用户解决一些问题,但离真正成为智能助理的目标还有很大距离。

从技术的角度来讲,单轮对话和简单多轮对话技术,特别是命令型和问答型对话技术,在一定程度上已经比较实用,虽然还有很多具体问题仍需解决。

数据堂自制版权的系列数据集产品为“自然对话语音数据”这一技术路径的实现提供了强有力的支持。

1,351小时普通话自然对话语音数据(手机+录音笔)

该数据由1950名发音人参与录制,以自然方式进行面对面交流,针对给定的数个话题自由发挥,领域广泛,语音自然流利,符合实际对话场景。1,351小时普通话自然对话语音数据由人工转写文本,准确率高。

2012年以来,深度学习给人工智能领域带来了革命性的变化。在语音对话方面,主要体现为语音技术的巨大进步。1994年ACM图灵奖获得者拉吉·瑞迪(Raj Reddy)教授曾发出这样的感慨:10年前我不会觉得在我有生之年可以看到机器能够这样准确地识别人的声音。

编辑搜图

请点击输入图片描述(最多18字)

相比之下,基于深度学习的语言技术的进展并没有那么显著。自然语言处理是人工智能最具挑战的领域。在对话方面,挑战主要体现在语言的表示与理解以及任务的表示与完成上。我们还不知道如何让计算机像人一样表示与处理具有多义性和多样性的语言,还不知道在计算机上如何有效地表示和处理极其复杂的各种任务。

当前的自然语言对话,一方面已有技术趋于成熟实用,另一方面新技术的突破有待今后长期的努力。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20220920A07G6P00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券