每日进步,不了解人工智能?一篇文章看懂BAT布局的语音识别技术

目前人工智能热火朝天,语音识别、图像识别、自动驾驶都是热门话题,今天我们就聊聊语音交互需要哪几个环节。现在打着AI旗号的智能产品哪些是用了语音智能交互。

什么是语音交互?如果你是苹果手机,一定调戏过siri,这就是典型的语音智能交互,还有今年双11天猫大卖的天猫魔盒,亚马逊echo,也是通过语音控制家电,属于语音交互的一部分。

最基本的语音交互包括语音识别和对话管理,语音识别是负责让机器理解你说的话,语音合成则是把结果用语音方式播报给你,所以分成两块来说:

语音识别:

人脑在听到一段话时会自动处理翻译成可以理解的意思,但是机器不行,汉语每个发音可能有几十甚至上百个字,所以语音识别不仅要识别你的发音,还要把这一串发音解析成你真正表达的那些字。

这是怎么做到的呢?首先通过声学模型知道你的发音,你可以理解为我们的拼音,然后还需要一个语言模型,它可以根据前后的文字、上下文对话来计算出每个发音最可能的意思。所以有时你会发现,在说第一个字的时候可能屏幕显示A,但是当说完一个词后第一个字会被纠正为B。

语音识别技术的好坏,除了用错误率来衡量,还有使用场景的广泛度,比如智能电视,它只需要听懂你说「换台」「声音」几个关键词,最多加入电视节目的数据就够了,它所需要理解的范围就这么大,你对它说「冰箱」,它识别不了也没什么大不了。

如果轻松理解了语音识别,恭喜你,已经入门人工智能,后面的内容对你来讲就没有难度了!

语音合成:

相比语音识别,语音合成就简单多了,它只需要把生成好的内容用符合人说话音量和节奏的方式输出出来,有个几百万条说话样本做训练,所谓的深度学习会搞定一切,你都不需要了解它是怎么学的!

像是你每日在听的导航,你以为每一句都是林志玲或者郭德纲说的,其实她们只要提供日常说话的数据,其他都是机器合成的。

看到这里似乎你已经了解高大上的语音交互了,但是从语音识别到语音合成,有没有觉得缺少了很重要的一环,就是语义理解和对话管理。

语义理解:

顾名思义就是理解你说的意思,语义理解和语音识别是紧密相连的,同一句话可能有很多不同的含义,在语音识别准确地识别出你的文字后,语义理解还要明确你表达的意思。

如果就是多义词没法理解怎么办?也有办法,就是语意澄清,比如你说「美人鱼」,系统可以通过询问:你是想了解「美人鱼」是什么,还是要看「美人鱼」这部电影?这种方式来澄清问题或者范围。

看到这里你已经了解了80%的知识了,只剩最后一项。

对话管理

对话管理连接了语义理解和语音合成,也就是帮你准备答案的过程。

如果你只是寻求知识,那就像是在百度输入文字搜索答案一样简单,前提是你的背后有类似百度这样的信息存在,且不能向用户播报几百条结果让用户筛选。

但如果是聊天机器人或者智能生活管家这样的角色,它就需要经过大量的学习和训练,了解你每一句话、每一个字的真正需求,并给出方案。这一步到目前为止各个公司都还在努力。毕竟,能通过图灵测试的计算机至今也没多少。

看到这里基本就要结束了,恭喜你在人工智能语音领域超过90%的人,看下面这张图复习一下:

最后小编多说一句,语音识别、语音合成、语义理解、对话管理,它们只是最核心的环节,真的要做一个智能交互助手,你还需要语音唤醒、声纹识别、降噪、声音加强等以适应真实的使用环境,不过作为科普贴这些没那么重要,记得名词的话拿来显摆一下就好啦。

本文来自企鹅号 - 四库全说媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

LeCun列传:曾因AI理论遭人唾弃,如今终成一代大神

李杉 陈桦 若朴 编译自BuzzFeed 量子位 出品 | 公众号 QbitAI 距离Facebook门罗帕克总部约3000英里之外,在曼哈顿市中心一栋老旧的米...

2966
来自专栏智能算法

Google为何能在机器学习领域始终居霸主地位?

这不是武侠世界——她已经做到了。26岁的Holgate得到了第二条跆拳道黑带。这次是算法的黑带。Holgate花费数个星期沉浸于一个程序中,这次比肉搏更...

3439
来自专栏AI科技评论

学界 | Jeff Dean撰文:谷歌大脑是如何完成科研使命的?

AI科技评论按:如果说起谷歌,想必你一定不会忽略Google Brain(谷歌大脑团队)。谷歌大脑在2011年初由吴恩达、Jeff Dean牵头组成,并在后来相...

3448
来自专栏机器之心

业界 | 快手AI技术副总裁郑文:为什么说AI是短视频平台的核心能力

郑文是美国斯坦福计算机系博士,研究方向主要集中在计算机图形学和电影特效方面,毕业之后在美国从事机器学习和计算机视觉相关研究,2016 年回国后加盟快手,现任快手...

843
来自专栏PPV课数据科学社区

个性化推荐技术的十大挑战

点击上方 “蓝色字” 可关注我们! ? 个性化推荐经常被人误解为细分市场和精准营销这两个概念。虽然它们之间有一些联系,但实质上却相差甚远。本文不仅清楚地讲述了...

2966
来自专栏AI科技评论

阿里巴巴首场NLP学术研讨会,顶尖名师与企业工程师碰撞产学研火花

阿里巴巴达摩院机器智能技术实验室自然语言理解研究组所举办的本次会议旨在搭建高校学术与企业实践的交流平台,增进校企合作,创新自然语言处理新技术。

1056
来自专栏罗超频道

2014年百度瞄准图像搜索

摘要:李彦宏早在三年前便宣称“读图时代”的到来,而瀑布流、Pinterest、Snapchat等图片应用更是掀起了图片应用之风,图片已经成为移动设备最重要的内容...

2735
来自专栏腾讯大数据的专栏

数据运营实战(一):细分目标人群,结合用户特征分析的实践

分群是精细化运营的常用方式。通过用户分群设置,将用户群切割成更细粒度,以推断并定位对关键事件/指标有明显影响的因子。

6471
来自专栏镁客网

又一项目击败人类,阿里巴巴的AI模型阅读理解精准率超越人类 | 热点

1343
来自专栏PPV课数据科学社区

【数据分析】互联网和金融,在数据挖掘上究竟存在什么区别?

一、数据挖掘的层次 一直想整理下对数据挖掘不同层次的理解,这也是这两年多的时间里面,和很多金融领域、互联网做数据相关工作的小伙伴,聊天交流的一些整理和归纳。大概...

3569

扫码关注云+社区