专栏首页曼孚科技AI语音交互领域常用的4个术语

AI语音交互领域常用的4个术语

​语音交互是基于语音输入的新一代交互模式,比较典型的应用场景是各类语音助手。

本文整理了语音交互领域常用的4个术语,希望可以帮助大家更好地理解这门学科。

1. 语音合成标记语言(SSML)

语音合成标记语言的英文全称是Speech Synthesis Markup Language,这是一种基于XML的标记语言,可让开发人员指定如何使用文本转语音服务将输入文本转换为合成语音。与纯文本相比,SSML可让开发人员微调音节、发音、语速、音量以及文本转语音输出的其他属性。SSML可自动处理正常的停顿(例如,在句号后面暂停片刻),或者在以问号结尾的句子中使用正确的音调。

2. 语音识别技术(ASR)

若要实现机器与人类的对话,就要经过三个步骤:听懂、理解与回答。语音标注技术的目标就是将人类语音中的词汇内容转换为计算机可读的输入。语音识别技术可分为以下四个流程:

目前,手机里的语音助手是语音识别技术最典型的应用之一。

3. 音素(phone)

音素是根据语音的自然属性划分出来的最小语音单位,通俗点来说其实就是人在说话时,能发出最最最最短小、简洁的不能再分割的发音。不同的音素就是不同的短发音,可以组成不同的长发音,再组成词句形成语言。

4. 语音合成(TTS)

语音合成是通过机械的、电子的方法产生人造语音的技术。通俗点来说,语音合成就是让机器模仿人类说话。即输入一段文字,最终输出一段语音。语音合成技术目前主要应用在读书软件、导航软件、对话问答系统等领域。

原文链接:https://mp.weixin.qq.com/s/5jstc1p-Wz87-4k2tNJMcA

我来说两句

0 条评论
登录 后参与评论

相关文章

  • AI算法领域常用的39个术语(上)

    Attention的本质是从关注全部到关注重点。将有限的注意力集中在重点信息上,从而节省资源,快速获得最有效的信息。

    曼孚科技
  • AI算法领域常用的39个术语(下)

    生成对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型,是最近两年十分热门的一种无监督学习算法。生成对抗...

    曼孚科技
  • AI机器学习领域常用的15个术语

    本文整理了一下机器学习领域常用的15个术语,希望可以帮助大家更好的理解这门涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多个领域的庞杂学科。

    曼孚科技
  • AI自然语言处理(NLP)领域常用的16个术语

    NLP研究的是实现人与计算机之间用自然语言进行有效沟通的各种理论与方法。本文整理了NLP领域常用的16个术语,希望可以帮助大家更好地理解这门学科。

    曼孚科技
  • 【犀牛鸟·视野】SIGGRAPH ASIA 2018: Siren AI - 高保真可交互虚拟人

    ? ★导语★ ? 英国演员Alexa Lee通过动捕设备实时驱动数字人Siren,这标志着实时高保真数字人技术迈向了一个新的高度。技术的进步为Siren赋予了...

    腾讯高校合作
  • 搜狗做AI:围绕语言,力出一孔

    数千万年前,猿猴为了生存,学会使用石器,跳下大树直立行走,从而为人;人类为了更好地交流,发展出语言;为了记住过去,又发明了文字,从此人类有了有记载的历史。

    罗超频道
  • 科大讯飞:智能语音识别率高达98%,支持22种方言

    回看2017,科大讯飞取得了哪些举世瞩目的突破成就?又在AI赋能营销领域实现了怎样的不朽成果?全方位展示+深度解读关于智能营销,那些你不知道的事…… ? 201...

    BestSDK
  • 专访俞栋:多模态是迈向通用人工智能的重要方向

    随着语音识别、自然语言处理、计算机视觉等人工智能技术日益成熟,并逐渐落地到实际场景中,如何实现大规模应用落地或者说如何通往通用人工智能,越来越成为这些领域的研究...

    AI科技评论
  • AI预测技术在语音交互的落地 | 微软新一代全双工语音交互技术 | 智能语音 | 解读技术

    近日,微软(亚洲)互联网工程院宣布率先推出新一代的语音交互技术:全双工语音交互感官(Full-duplex Voice Sense),与既有的单...

    用户7623498
  • 互金公司的AI野心,还要经历几重考验?

    未来几年小风口可能不断,但大风口只有一个,即人工智能。在互金行业,早已掀起“AI热”,不管有没有数据,有没有场景,几乎所有公司都在宣传自己是应用人工智能的金融科...

    用户1310347
  • 重磅 | 从SwiftScribe说起,回顾百度在语音技术的七年积累

    人与机器的自然交互一直是人类孜孜不倦的奋斗目标。随着移动互联网时代的发展,声音与图片成为了人机交互更为自然的表达方式。作为最核心的入口,语音技术就成为了科技巨头...

    AI科技评论
  • 搭乘AI列车,腾讯正式发布人工智能助手腾讯叮当 | 热点

    镁客网
  • 深思考杨志明:AI赋能行业,云+端双模式落地商业、医疗大健康领域 | 镁客请讲

    多模态深度语义理解技术是深思考的核心技术,目前在中文语义理解、多轮人机交互和机器阅读理解方面均取得突破。

    镁客网
  • 清华大学成立听觉智能研究中心,要解决可解释和鲁棒性问题

    听觉和语音一直是AI领域研究和应用的重点,中国科学院院士、清华大学人工智能研究院院长张钹认为,在后深度学习时代,听觉智能应该成为AI领域重要的分支。

    量子位
  • 腾讯云王琰:腾讯云AI Cloud的技术、应用布局和趋势

    简单来说,腾迅云AI Cloud服务矩阵服务三类目标群体,一个是基础研究。基础研究员可以通过云服务器以及深度学习平台快速搭建一个学习环境,以加速技术研究。

    云资讯小编
  • 注意!曾改变中国人打字方式的搜狗,现在要改变老司机的开车方式

    今天微软宣布成立人工智能通用实验室,研发AI系统以挑战谷歌Deepmind,再联系到微软、苹果、Amazon等互联网巨头的动作,我们看到顶尖互联网公司都在布局人...

    罗超频道
  • 思必驰的AI语音突围

    今年8月,AI语音独角兽公司思必驰完成了数亿元Pre-IPO轮融资,参与本轮投资的包括美的资本、中信证券投资、元禾控股等知名投资机构。思必驰表示,融资后将加大对...

    用户6173838
  • 滴滴开源AI项目登上GitHub热榜,人机对话模型可从论文到产品部署无缝衔接

    没想到,滴滴开源的自然语言理解(人机对话)模型训练平台,就这样登上了GitHub热榜。

    量子位
  • 百度AI加速器首期“毕业典礼”:都有谁?会把AI带向何处?

    把AI喊得最响的百度,于2017年12月,开门集结了21个AI相关项目,并在其后4个月时间中,集训加速,利用百度在AI领域的资源,为创业者加速,把AI技术、产品...

    量子位

扫码关注云+社区

领取腾讯云代金券