首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

智聆口语评测(中文版)新品发布

如何拯救普通话? 过去,中文口语评测高度依赖专业教师听后进行主观评估,成本高、费时费力。 现在,“AI教师“陪你学中文。...功能特性 全年龄段覆盖 支持从儿童到成人,全年龄段覆盖的中文普通话评测打分,针对儿童提供个性化、差异化的评测能力支持。...不是专家,胜似专家 智聆口语评测语音评测打分结果与专家打分拟合度 95% 以上,可广泛应用于普通话教学业务中。...应用场景 1 普通话评测 根据普通话水平测试规范,分别进行单音节字,多音节词语,文章朗读进行普通话发音打分,估算考试成绩。 ?...2 幼教发音启蒙 可针对幼教场景下的语言学习,针对字、词、句子等的发音情况进行语音评测。 ? 3 口语作业批改 可针对培训机构的课后朗读课文以及唐诗等,在学生提交的时候进行在线批改。 ?

5.7K30

ASR(语音识别)评测学习

希望对测试小伙伴有所帮助~~(●—●) 二、ASR流程、系统结构、评测指标及评测模型 1、语音识别(Automatic Speech Recognition,ASR) 语音识别,也被称自动语音识别,所要解决的问题是让机器能够...4、语音识别(ASR)评测指标 语音识别(ASR)评测指标:WER(字错误率)和SER(句错误率) (1)....2、语⾳识别评测影响因素 (1). 声音来源(人声 录音声 广播声 耳机 麦克风 单/双通道/立体声) (2). 语种分类(普通话 方言 英语 小语种 混合语言) (3)....录入语音时长(0秒 1秒 1分钟内 >1分钟) (10).对话方式(间隔 连续 单人 多人) (11).特殊发音(比如普通话中sh与s ping与pin l与n f与h) 四、ASR评测方案制定...1、ASR评测方案设计——确定测试场景(简单举例) 考虑评测的各种影响因素,需要先确定某些维度(下例),制定一个测试场景评测: 确定:语种分类(普通话)、声音来源(人声录音)、对话方式(单人)、语音内容

7.3K51
您找到你想要的搜索结果了吗?
是的
没有找到

指标权重设计——如何评测语音技能的智能程度(终篇)

《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第5篇,也是最后一篇。...评测语音技能的智能程度有4大维度: 如何评测语音技能的智能程度(1)——意图理解 如何评测语音技能的智能程度(2)——服务提供 如何评测语音技能的智能程度(3)——交互流畅 如何评测语音技能的智能程度(...语音技能评测指标的选择和量化 这份清单花了笔者太多的时间,仍然有太多的问题值得讨论: 为什么是4个维度,而不是5个或者是3个? 基于什么依据设置每个维度的重点和加分项?...ASR这项技术未来差距很可能会被抹平,而如果做到了方言转普通话然后转文本那就是另外一个话题了,方言转普通话和任何一种语言转普通话是同一个逻辑。那笔者可能会归纳到【意图理解】维度上。...语音技能服务的上限和下限 除去调研和评测其他智能语音技能,这份清单的还可以用于服务的产品定位,以及作为清单来评价语音技能服务表现。

4.7K20

Chrome语音搜索评测:效果华丽!可惜大墙相隔

笔者使用中文普通话进行了一轮评测,识别效果超出我的预期。除了PC端使用场景有限,识别效果仍不够完善,最大的问题是:得访问外国网站。下面是一个简单评测。...这也是其与移动版Chrome的语音搜索和百度语音搜索一大不同。 7、Case1、较为标准的普通话:阿里巴巴的创始人是谁?准确识别,答案为马云。...9、Case3、加快语速的普通话:广州明天的天气。准确识别并展示天气。 10、Case4、玩残它也很容易。“合伙人”被识别成了合肥人。...如果不访问外国网站,别说语音搜索,访问Google也会经常出现大家熟悉的界面。 评测总结: Google语音搜索对于中文用户来说具备可用性。...语音输入除了声音转换为文字外,搜索引擎更需要从自然语言精准理解用户需求,并以知识图谱的形式反馈个性化的结果。从评测看,Google表现优秀。

4.6K70

TTS系统评测方法介绍--WSRD AI评测实验室

杂音,在合成语音过程中引入背景噪音、字与字之间不流畅的杂音。 二、评测指标介绍 针对上文提到的前后端可能存在的问题,选择如下指标来评测TTS。...韵律准确性=停顿可接受用例数/总的用例数×100% 字典覆盖率 为检查语音合成系统对汉字的覆盖程度,建立覆盖汉普通话不同等级的字库和生僻字库的测试语料,通过TTS前端输出工具,检查是否能正常处理,统计字典覆盖率...可根据产品实际情况选择是否需要评测此项。 MOS 业界对语音的整体评测,一般是使用MOS。邀请听音人试听合成语音,根据分值描述,从拟人性、连贯性、韵律感等方面为语音选择合适的分数。...以年代形式出现的数字应该根据上下文区分是进制读法、位制读法还是顺序读法,如中国在4000年前就开始物种驯化,中“4000”应该是进制读法“四千”;秦朝建立与公元前221年,中“211”应该是位制读法“两百二十一年...评测方法 合成语音后,通过听语音来判断发音正确下的效率太低,实际评测过程中可直接对前端的发音预测结果进行校验,测试语料通过TTS前端,输出每个字的读音和音调,对比实际输出与期望输出判断对错。

15.9K114

TTS评测--方案介绍和实践分享

[665498vizl.png] 2.3  字典覆盖率 为检查语音合成系统对汉字的覆盖程度,建立覆盖汉普通话不同等级的字库和生僻字库的测试语料,通过TTS前端输出工具,检查是否能正常处理,统计字典覆盖率...可根据产品实际情况选择是否需要评测此项。 2.6  MOS 业界对语音的整体评测,一般是使用MOS。邀请听音人试听合成语音,根据分值描述,从拟人性、连贯性、韵律感等方面为语音选择合适的分数。...以年代形式出现的数字应该根据上下文区分是进制读法、位制读法还是顺序读法,如中国在4000年前就开始物种驯化,中“4000”应该是进制读法“四千”;秦朝建立与公元前221年,中“211”应该是位制读法“两百二十一年...评测方法 合成语音后,通过听语音来判断发音正确下的效率太低,实际评测过程中可直接对前端的发音预测结果进行校验,测试语料通过TTS前端,输出每个字的读音和音调,对比实际输出与期望输出判断对错。...当前TTS的MOS大都高于4分,因此我们在传统MOS五档分值中加入了4.5分档,打分及描述如下: [5mj4z5mcdg.jpeg] 评测方法 (1)分别合成被测TTS、对照TTS的语音,并且录制一份声优语音混入一起测试

6.5K62

腾讯教育智聆口语评测亮相微信公开课,英语好不好AI告诉你

“没想到我的中文语音测评分数竟然还没有英文高,看来我要好好练习一下自己的普通话发音了。”...“ 有来头:解读智聆口语评测的“前世今生” 智聆口语评测是由腾讯云团队基于微信“智聆”的技术与应用基础,创新算法研发而成的语音评测产品。...“3”即三大产品特性 1 首先,智聆口语评测支持从儿童到成人全年龄段覆盖的英语语音评测打分,并且针对儿童提供个性化、差异化的评测能力支持 2 其次,全方位打分机制,通过发音准确度、流利度、完整度等多维度解读...智聆口语评测语音评测打分结果与专家打分拟合度 95% 以上,可广泛应用于英语口语类教学业务中 “5”指五种评测模式 即通过单词、句子、段落、自由说、情景对话不同模式,重塑学习场景,深度渗透教、管、练...同时,针对不同的用户,推出四大应用场景:在口语能力测评场景里,快速了解学生英语口语评测,提供多维度的语音评测结果,方便课程安排;在在线绘本跟读中,针对少儿英文绘本的单词和句子跟读的情况进行语音评测;在课堂质量评估场景

21.6K20

【AI专栏】语音合成系统评测介绍

在合成语音过程中引入背景噪声、字词间隔不顺畅。 二、客观评测 针对前后端可能存在的问题,本评测方法选择如下语料和指标对TTS系统做客观评测。...,准备测试语料,包括语料文本,待检查词汇,标准发音等,合成语音后人工评测发音准确率。...[sprQsyQ.png] (3)字典覆盖率 检查语音合成系统对汉字的覆盖程度,检测字表包括普通话不同等级的字库和生僻字库,输入字库语料,检查是否正确合成,统计覆盖率。...三、主观评测 1、MOS评测 国际上对语音自然度的评测,一般是使用MOS评测,邀请听音人对被测系统输出语音打分衡量。...目前我们的评测是培训众测用户做为听音人,流程大致如下: (1)双方语音音量归一化; (2)语音字词发音准确性校验; (3)生成众测问卷,语音顺序交叉打乱; (4)众测用户培训,试听自然人声和较差合成音锚定打分标准

11.2K20

当直播电商用上 AI 实时翻译,歪果仁也能听懂李佳琦

11」的购物潮流也已触及全球 200 多个国家和地区 不过,在「 11」全球化的同时,也面临着新的挑战。...直播中,即使环境嘈杂、店家普通话不标准、带有方言或口语化,AI 实时翻译仍然能够做到精准翻译。 ?...阿里透露,该技术将于今年天猫「双十一」之前大规模应用 此前,语言问题一直是商家做海外直播路上的拦路虎。...跨境直播,对实时翻译提出了新要求 目前市面上不乏语音翻译工具,但是,在跨境直播这一特殊场景中,对语音翻译又提出了新的要求。...店家在直播过程中很容易出现一些口语化表达 给实时翻译带来挑战 为解决「听不清、听不懂」的问题,阿里在业界通用方案的基础上,进行了以下升级: 自研了更智能的语音模型,可在嘈杂的环境中「听清」直播内容;

5.6K41

比起WE大会“救命的AI”,这个AI已经悄悄进入人们的学习中

能够完整,标准的说清普通话则调用成人的。根据使用者的发音标准调用对应的接口,接口不会区分使用者的岁数,只会根据发音标准拍判断。...(衬衫的价格是9磅15便士,所以你应该选B) 程序返回了一条error WordLengthTooLong-文本单词超过限制 被评估语音对应的文本过长 ▽ 2 被评估语音对应的文本过长。  ...@热心网友回复@技术支持: 如果不能变长的话,如果一段语音很长(我们没办法按断句把语音再切分划片,但没有超出),我们应该怎样处理呢?...还是等平台出“段落评测”功能再来耍耍 我提了提语速,在20s内念完了那句9磅15便士。 ?...4 调试口语评测时,数据传输接口频繁出bug  @热心网友提问: 智聆口语评测API功能接口发音数据传输接口 InitOralProcess可以正常返回, TransmitOralProcess这个接口总是报错

5.6K40

人工智能,应该如何测试?(五)ASR 效果测试介绍

这项技术涉及声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等多个学科。ASR 系统的性能受到识别词汇表的大小和语音的复杂性、语音信号的质量、单个说话人或多个说话人以及硬件等因素的影响。...根据语音的输入方式,可以分为孤立词、连接词和连续语音系统等。...此外,还可以根据输入语音的发音方式(如朗读式和口语式)、方言背景(如普通话、方言背景普通话和方言语音识别系统)以及情感状态(如中性语音和情感语音识别系统)进行分类。...效果流程数据收集标注音频数据将音频输入 ASR 算法模块得到输出结果(一个文本)计算模型评估指标评测数据集构建这个我们上面说过,我们需要收集各种类别的数据,这部分工作十分重。...deletion_rate:.2%}")print(f"Substitution rate: {substitution_rate:.2%}")总结可以看到通过 Levenshtein 库我们可以比较容易的把效果的评测自动化起来

20110

杨婷:腾讯云在线教育解决方案分享

PSTN比较抽象,手机通话、QQ语音通话,都是PSTN的能力,相关的电话销售可以与业务快速进行整合。...0020.jpg 我们的AI产品矩阵包括人脸识别类、文字识别类、图像识别类、语音及理解类。...中英文的语音转文字、机器翻译,这些与教育场景也是强相关的。我们还提供云字典去评估一段通话,例如客服输入输出的时长、关键字等。教学过程中老师的教学质量、学生的掌握程度,都可以通过语音字典进行分析。...0021.jpg 语音评测包括普通话和英语的评测,从单词、句子、准确度、流畅度等各个维度去打分。...在语言评测方面,国内的其他友商也在做语音识别,对于低龄的孩子来说,普通话都讲不清楚,语音评测是很有难度的。这块成人和小孩子的标准是不一样的,小孩子是以鼓励为主,所以我们常规的维度去评测是不适合的。

5.2K53

DeepSpeech源码编译及语音识别效果复现

DeepSpeech是国内百度推出的语音识别框架,目前已经出来第三版了。不过目前网上公开的代码都还是属于第二版的。...团队采用 7000 小时的干净语音语料,通过添加人工噪音的方法生成 10 万小时的合成语音语料,并在 SWITCHBOARD评测语料上获得了 16.5% 的 WER(词错误率,是一项语音识别的通用评估标准...当时的实验显示,百度的语音识别效果比起谷歌、Bing 与 Apple API 而言优势明显。...,通过将机器学习领域的 LSTM 建模与 CTC 训练引入传统的语音识别框架里,提出了具有创新性的汉字语音识别方法。...并能够通过深度学习网络识别嘈杂环境下的两种完全不同的语言——英语与普通话,而端到端的学习能够使系统处理各种条件下的语音,包括嘈杂环境、口音及区别不同语种。

2.6K20

小扎亲自演示首个「闽南语」翻译系统!主攻3000种无文字的语言

论文的第一作者Peng-Jen Chen出生和成长与于中国台湾,他讲普通话,但他的父亲主要讲闽南语,所以他们俩在进行复杂对话时感到很棘手。...研究人员利用普通话作为中间语言来建立伪标签(pesudolabel)和人工翻译。...首先将英语(或闽南语)语音翻译成普通话文本,然后将其翻译成闽南语(或英语)并将其添加到训练数据中,该方法通过利用相似的高资源语言数据,能够极大提高模型的性能。...闽南语可以与英语语音对齐,也可以与语义embedding相似的文本对齐。 然后从文本中合成英语语音,生成相似的闽南语和英语语音。 新的建模方法 大部分语音翻译系统都依赖于转录结果或语音到文本系统。...此外,UnitY 被用于通解码机制,其中第一通解码器生成相关语言(汉语)的文本,而第二通解码器生成单元。

1.1K20

电子阅读器市场角力,AI成为关键变量

目前科大讯飞已经在语音信号处理、语音识别、语音合成、语音评测等方面形成领先优势,并拥有全球最大的中文语音语料库,其中包括普通话、方言、英语、日语、韩语等多种语音的语料库,其在语义分析、情感分析、机器翻译...、自动摘要等方面,也具有较强的研发能力和技术实力,这些都为语音识别、语音合成等技术的应用,提供了强有力的支持。...普通话听腻了,用粤语、沪语、东北话等各地方言听书,也不失一番趣味,听觉体验直接拉满。...另一方面,作为基本的墨水屏阅读器,它支持24级冷暖色阅读灯进行冷暖色调节,300PPI高清显示,字迹更清晰的同时,护眼效果更佳;同时它内置讯飞、当当两大书城,还兼容微信读书、喜马拉雅等外部应用,内容资源十分丰富...与以往墨水屏一直囿于“阅读”单一功能不同,如今,随着智能语音合成技术与墨水屏的融合,墨水屏的功能中心,逐渐从“阅读”延伸到了“阅读+听读”,场景能力大大增强,AI智能语音合成技术引入带来的指数级听书体验跃升

60320

5 款购物小程序,助你「女王节」剁手一臂之力

买哪一件,买哪一?好像两件都很好看耶!两都想买! 怎么办?要是不想对钱包造成冲动式伤害,请打开张大妈出品的「购物决策助手」小程序,做出正确的购物决策。...这款小程序,精心准备了多款热门商品的选购问答。 只需做几个简单的选择题,它就能理清、抓住你的真实需求,在茫茫商品中,给你推荐最合适的那几款。...「值得买购物攻略」提供了更丰富的商品文章分类、更详尽实用的选购指南、购物攻略、商品评测、使用教程。 每一篇图文都是由原创作者精心收集、整理,以及亲身试用体验商品后做的推荐。...这款小程序早就为你想到了,为了打消用户的顾虑,「微店买买」还设置了商品评测,对「婴儿用品」、「餐厨用具」、「文化用品」、「居家生活」、「美妆个护」这五个分类的商品,从安全性等方面进行了评分,为你选择合适的商品提供参考依据

2.4K30

10岁是个分水岭!根治英语头疼病,这支笔了解一下

依托科大讯飞的语音评测技术,P20还提供发音纠正功能,帮助孩子们及时了解自己发音的问题,及时反馈纠正。...除了提供中英文自动语音翻译以外,还采用中高考听说口语评测同源技术,支持跟读评测,按照考试标准练发音。...评测结果是多维度的,AI算法评测解码和计算的核心模块,通过语音识别(ASR)解码转译,与给定的文本对齐结合发音的音素、语调、流利度、断句、完整度等内容,给出一个综合评分。...总体而言,科大讯飞在AI翻译笔上运用了:OCR识别、语音识别、机器翻译、语音合成、语音评测、语法分析、作文批改等技术。...在语音合成方面,则是取得了Blizzard Challenge国际语音合成大赛十四连冠佳绩。 除此之外,科大讯飞还是国家普通话水平测试及英语口语测试技术供应商。

8K30

那些语音识别尴尬:投宿还是投诉?

有网友曾戏谑:再智能的语音识别,遇到同音字(词)都可能“秒变智障”。 有时候,明明是一个温馨感动的时刻,语音识别偏偏剑走偏锋,让你措手不及。 例如: 一下子画风突变。...而语音识别在同音字(词)方面的尴尬还不止于此。...具体来说, 腾讯云语音识别的中文普通话引擎新上线了热词增强版功能,通过热词拼音匹配,可以有效提升热词在识别结果中的命中率,适用于原创词汇、专有词汇较多的电话和通用业务场景。...目前,热词增强版支持实时语音识别、录音文件识别、一句话识别三种子产品,仅支持中文普通话。 据相关产品经理介绍,此功能建议用于专有词汇,注意避免一个热词表包含多个同音词。...| 又叒叕入选!| 强势助力!| 全球 Top2!

76130

全球首个AI合成主播发布,效果以假乱真!揭秘背后技术原理

听起来不难,实现却要经历“九九八十一难”。 人前近乎炫技的综合能力,幕后是一项又一项来不得半点马虎的小技术达成。 技术原理 背后包含了2大AI引擎。 一是语音合成引擎。...在语音合成引擎中,基于用户少量音频数据,使用搜狗个性化语音合成技术,快速学习用户音色、韵律、情感等多维度特征,建立输入文本与输出音频信息的关联。 另一个是图像生成引擎。...、IWSLT2018国际口语机器翻译评测大赛全球第一; 人机对话:在NLPCC 2018比赛中,搜狗语义理解技术获得第一名、NTCIR 2017评测比赛短文本对话任务第一; 机器视觉:在自动驾驶领域国际顶级评测...CVPR WAD 2018道路目标检测任务全球第一、Pascal VOC 2018挑战赛目标检测Competition 3,4两项子任务,全球第一、国际自动驾驶领域权威评测集Cityscapes 2018...实例分割评测任务全球第一、MegaFace 2018人脸识别任务,以99.939%的准确率,获全球第一。

1.2K10

18载艰苦创业,曾动念房地产转型,讯飞的江湖夜雨和桃李春风

在此基础上,依靠在语音合成、语音识别、口语评测、语言翻译、声纹识别、人脸识别、自然语言处理等核心技术方面的储备,他的目标和野心,将涵盖多个“重金”领域。...可能鲜为人知的是,如今官方指定机测系统的全国普通话评测系统,创立者正是科大讯飞创始人及现任董事长刘庆峰。 等到2008年上市,最先在多省市铺开的也是教育方面的技术。...当时在安徽、上海、江苏、辽宁和重庆,讯飞推出了普通话口语评测技术,志在成为变革中国教育的“技术方案商”。 而2010年,教育正式被认定为公司新的利润增长点,然后兼收并蓄,利用资本开启扩张。...先是2013年,科大讯飞并购应试教育信息化相关的广东启明科技;其后2014年,推出应试相关的评测系统智学网;接着2016年,先是控股投资K12教育项目解铃网,然后又完成了另一家K12教育公司乐知行的全资收购...此外就在昨日,科大讯飞还与安徽省立医院宣布共建“安徽省立智慧医院(人工智能辅助诊疗中心)”,这也是今年8月讯飞刷新了医学影像国际权威评测LUNA的世界记录后,面向医疗领域展开的又一重要试水,利用人工智能帮助医疗读

1.2K60
领券