开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

人工智能发音打分技术

人工智能发音打分技术是一种利用机器学习和深度学习技术来模拟人类专家对语言发音评估过程的技术，它通过分析语音的发音、语调、语速、流利度等多个方面的特征，来评估说话者的语言水平，并给出相应的分数。以下是关于该技术的基础概念、优势、类型、应用场景，以及在实际应用中可能遇到的问题和解决方法。

基础概念

人工智能发音打分技术，也称为自动语音评分（Automatic Speech Scoring, ASS），是一种自动对语音进行评分的技术。它通过分析语音的发音准确性、流利度和语调等特征，来评估说话者的发音质量。

相关优势

自动化评分：节省人力资源和时间成本。
客观公正：提供客观、一致的评分结果，避免主观因素的影响。
即时反馈：学习者可以即时获得对自己发音的评估结果和反馈，帮助其及时调整和改进发音技巧。
个性化教学：针对不同地区口音和个人学习进度进行个性化训练。
广泛应用：适用于教育培训、考试评估、语音纠错等多个领域。
提高学习效率：帮助学习者迅速调整发音并及时改进，有效提升口语技能。通过提供即时反馈和个性化建议，AI发音打分技术能够显著提高学习者的口语能力和学习效率。

类型

基于规则的评分系统：使用预定义的语音和语言规则来评分。
基于机器学习的评分系统：通过大量数据训练模型来进行评分。
混合评分系统：结合规则和机器学习的方法。AI发音打分技术主要有两种类型：基于规则的评分系统和基于机器学习的评分系统。

应用场景

教育培训：在线英语学习平台、语音教学软件等，帮助学习者自主学习和提高口语表达能力。
考试评估：英语口语考试的评估，提供客观的评分标准和结果。
语音纠错：纠正学习者的发音错误，提供针对性的改进建议。这种技术在语言学习产品中增加，不仅能够自动批阅大规模的口语作业和试卷，还能自动生成学习分析报告，指导教学进程和方向。

遇到的问题及解决方法

问题：系统评分不准确。
原因：可能是模型训练数据不足或不全面，或者用户的声音特征与训练数据差异较大。
解决方法：更新和扩充训练数据集，确保涵盖多种声音特征；使用更先进的算法优化模型。
问题：系统无法识别某些方言或口音。
原因：方言和口音与标准语言差异较大，导致识别困难。
解决方法：在训练数据中加入不同方言和口音的样本，提高模型的泛化能力。

通过上述分析，我们可以看到人工智能发音打分技术不仅在理论上具有深厚的背景和广泛的应用，而且在实际应用中也展现出了巨大的潜力和价值。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

老师们欢欣鼓舞：Gradescope 将人工智能技术用在打分数这件事上

一名加州大学柏克莱分校的教授和三名前研究生正在对一项人工智能技术进行最后调整，这项技术可以将学生们的答案进行集合分类，再一起打分数。...这项正在进行测试的功能采用人工智能技术，今年秋天将正式推出在线打分数程序 Gradescope 的最新功能。研究团队两年前成立公司时推出这项 app，目的在遏止作弊歪风。...在2014年取得计算机科学博士学位、Gradescope 共同创办人的 Sergey Karayev，表示加入人工智能技术能将打分数的时间减少 90%。...高度可重复性人工智能技术并非直接用于打分数这件事上，而是学习怎么对答案进行分辨和综合分组，并且批次进行，将打分数这件事变成一项具高度可重复性的自动化作业。...如此一来让身陷打分数苦海里的老师们能松一口气。 Abbeel 写道：“公平一致地打分数是很重要没错，却也是老师们觉得最无聊的。在没有人工智能技术的辅助下，这变成一件极为耗时的事情。”

3.3K8 0

你一定听过这些不太标准的技术圈发音...

注：本文转载自公众号腾讯技术工程（即下文中的“他二哥”）。大家好，我是他二哥。混迹技术圈的这些年，你都听到过哪些奇奇怪怪的发音？比如，密钥读“miyue”？AJAX读“阿贾克斯”？...今天，就让他二哥来给大家上一课，纠正一下技术圈内的那些不标准但是很普遍的发音！小本本拿出来！...点击空白处查看标准发音 ▼ 点击空白处查看标准发音 ▼ 点击空白处查看标准发音 ▼ 点击空白处查看标准发音 ▼ 点击空白处查看标准发音 ▼ 点击空白处查看标准发音 ▼ 点击空白处查看标准发音... ▼ 点击空白处查看标准发音 ▼ 点击空白处查看标准发音 ▼ 点击空白处查看标准发音 ▼ 点击空白处查看标准发音 ▼ 点击空白处查看标准发音 ▼ 点击空白处查看标准发音 ▼ 点击空白处查看标准发音...推荐阅读前以色列国防军安全技术成员教你做好 Serverless 追踪系统如何设计才能更快地查询到数据？替代Docker，登上顶刊，这款开源沙箱牛在哪里？

4153 0

AI发音练习APP的技术难点

AI发音练习APP的开发虽然前景广阔，但仍面临着一些技术难点。1. 语音识别的准确性和鲁棒性口音和方言差异：不同地区的用户口音差异很大，这对语音识别的准确性提出了挑战。...发音评估的准确性和客观性发音标准定义：英语发音的标准具有一定的主观性，如何准确定义和量化发音标准是一个难题。...评估维度：发音评估需要考虑多个维度，如音标、重读、语调、节奏等，如何综合评估这些维度并给出客观的评价是一个挑战。...模型优化：如何不断优化模型，提高语音识别和发音评估的准确性，是一个长期需要努力的方向。6. 多语言支持语言差异：不同语言的发音规则和特点不同，如何开发支持多种语言的AI发音练习APP是一个挑战。...总结AI发音练习APP的开发面临着诸多技术难点，需要不断进行技术创新和优化，才能为用户提供更好的发音学习体验。

1511 0

论文控|从扎克伯格账号被黑说起，谷歌神经网络如何实现“更安全”的验证

大会现场，谷歌，DeepMind，Uber，微软等巨头的人工智能实验室负责人将莅临深圳，向我们零距离展示国外人工智能震撼人心、撬动地球的核心所在。...笑谈之余，这个新闻让人们再次思考，未来更加安全的网络身份验证技术是什么？也许，正如未来人工智能语音交互将代替现在的APP交互，身份验证也会采用人工智能语音验证。...为了验证，发音 X 的打分函数值和测试用户 spk， S(X, spk）,与一个预先定义的阈值进行比较。...一个简单的打分函数，是发音 X 评估结果的用户表征 f(X)，与用户模型 mspk 之间的余弦相似度。...发音层面的方法比帧层面的方法更好，超出30%。在每一种方法中，分数标准化技术带来了重大的运行提升（相对提升了20%）。为了比较，这里展示了两个i-矢量基准。

1K16 0

智聆口语评测（中文版）新品发布

腾讯云推出的智聆口语评测（中文版），可以针对儿童或成人的中文发音，进行自动化打分，评分维度包括发音准确度、流利度、完整度等，与专家打分相似度在95%以上。 ? ? ? ?...多维度打分支持字词、句子、段落、自由说等多种评测模式，支持发音准确度、流利度、完整度等全方位打分机制。...不是专家，胜似专家智聆口语评测的语音评测打分结果与专家打分拟合度 95% 以上，可广泛应用于普通话教学业务中。...应用场景 1 普通话评测根据普通话水平测试规范，分别进行单音节字，多音节词语，文章朗读进行普通话发音打分，估算考试成绩。 ?...2 幼教发音启蒙可针对幼教场景下的语言学习，针对字、词、句子等的发音情况进行语音评测。 ? 3 口语作业批改可针对培训机构的课后朗读课文以及唐诗等，在学生提交的时候进行在线批改。 ?

6.7K3 0

NLP和计算机视觉在AI教育的那些年，数据桎梏一直是难点

国家层面也有体现，例如包括《新一代人工智能发展规划》与《教育信息化2.0行动计划》等政策的出台，给于了人工智能技术应用在教育领域的方向认可。...有了数据再谈人工智能是更切合实际的，如果没有数据就是空中楼阁。也就是说，当前部署人工智能教育的企业在核心算法技术上的差距并不明显。...从NLP中的语音分支来看，以智能发音评测为例，基础测评功能的实现技术门槛不高。然而，如果要评测系统能够精准的、全方位的，评价各个发音人的发音情况，则就需要海量精准化、多维度的标记数据。...更为具体一些，当前在一些NLP模型中，常用的语音评测技术，比如用于英语口语教学中的语音评测，一般都是采用智能打分技术对学习者的口语进行评测，而目前智能打分技术主要还是基于GOP(Goodness Of...多维度：6个维度打分：流利度，停顿，发音，语调，重音，综合。客观性：Native Speaker打分，客观可信。科学性：细颗粒度打分，精准定位发音问题。

1.6K2 0

AI发音练习APP的开发

AI发音练习APP利用人工智能技术，为用户提供个性化、高效的发音学习体验。AI发音练习APP的开发过程，主要包括以下几个方面。1....需求分析与规划目标用户：确定APP的目标用户群体，例如：英语初学者有一定英语基础，想提高口语水平的人群需要准备英语考试（如托福、雅思）的人群功能需求：根据目标用户群体，确定APP的核心功能，例如：发音评估与反馈...个性化学习计划多样化的练习模式（跟读、对话、游戏等）学习记录与跟踪社交互动功能技术选型：选择适合开发APP的技术栈，例如：前端技术（如React Native、Flutter）后端技术（如Node.js...技术设计与开发语音识别与评估模块：接入AI语音识别引擎，实现对用户语音的准确识别。设计发音评估算法，对用户的发音进行打分和反馈。优化语音识别效果，提高识别准确率和鲁棒性。

2021 0

人工智能技术

材料：党的十九大报告提出，推动互联网、大数据、人工智能和实体经济深度融合。...今年7月，国务院在印发的《新一代人工智能发展规划》中，对我国人工智能发展明确提出了三步走的战略目标，其中第一步，是到2020年达到总体技术和应用与世界先进水平同步，人工智能产业成为新的重要经济增长点，人工智能技术应用成为改善民生的新途径...新一代人工智能技术，主要由商业需求尤其是互联网需求推动，对传统产业的渗透广度、深度是前所未有的，同时也面临着与产业发展的广泛结合问题。...例如跨媒体感知计算技术的发展，将为一系列存在安防需求的行业，如停车场、银行、学校、仓储物流等提供人脸识别等智能化应用。...一是因势利导，加大开放投入，形成产业，引领世界先进技术。二是建立国家标准，形成规模，建立健全管理规章制度。

8508 0

跟AI学口语，鹅厂“神器”了解一下

AI如何拯救你的口语发音？作为AI语音识别技术，智聆口语评测是由腾讯云团队基于微信“智聆”的技术与应用基础，创新算法研发而成的语音评测产品。...针对K12教育中常见的问题，智聆不仅熟练运用AI语音识别技术，不断优化算法，还研发出神秘武器让听和写变得更简单！...不服跑个分智聆将通过多维度打分机制，从发音准确度、流利度、完整度多方面评估你的口语，让你对自己的发音水平拥有更加科学地认知。...AI口语“砖家” 智聆口语评测的语音评测打分结果与专家打分拟合度95% 以上，就如同把一位真人口语专家请到家中，随时随地陪你开练，给你不标准的地方“拍砖”，促进口语提升。...目前，智聆已经帮助Vipkid、美联英语、叽里呱啦等众多教育机构，实现对学员口语发音的准确度、流利度、完整度的人工智能评估，让学员或家长了解学习成果及不断自我修正。

8K3 0

短期爆发音视频需求背后的技术与发展趋势解读

一个技术不能说它好就可以去使用，而是由外在条件去决策它是否可以大规模使用，成本和技术升级都是要去评估的指标。...另外，我们也在积极探索一些其他的技术，比如SRT，后续我们可能也会找一些场景进行测试，但对于技术一定需要一个时间周期。...但技术发展到今天可以发现两个技术路线在不断地融合，做流媒体的人想用RTMP拉流的方式实现多人的连麦互动，做RTC的人不断地扩大房间的人数上限，变得越来越像直播，但其实这背后的技术路线，WebRTC在其中扮演着非常重要的角色...刘连响：首先从技术上来说，例如说我们去做一些技术扩容，一定是在科学合理的预估之下进行的谨慎扩容，但即便如此依然存在预估不到位，实际流量超出扩容阈值等问题，还有像扩展性等问题仍需进一步优化。...问 Q2：目前来看WebRTC技术感觉还是很不稳定，想听下老师对WebRTC技术的前景看法，以及腾讯云上是否有采用WebRTC技术的成熟产品应用？答 ?

1.1K1 0

TTS评测--方案介绍和实践分享

导读语音合成（Text To Speech，TTS）技术将文本转化为声音，目前广泛应用于语音助手、智能音箱、地图导航等场景。...TTS的实现涉及到语言学、语音学的诸多复杂知识，因合成技术的区别，不同的TTS系统在准确性、自然度、清晰度、还原度等方面也有着不一样的表现，如何从多维度综合评价TTS系统质量成了TTS测试人员的一大挑战...因此我们将MOS评测与两两比较法相结合，并引入上标锚定打分标准，使结果相对稳定。...当前TTS的MOS大都高于4分，因此我们在传统MOS五档分值中加入了4.5分档，打分及描述如下： [5mj4z5mcdg.jpeg] 评测方法（1）分别合成被测TTS、对照TTS的语音，并且录制一份声优语音混入一起测试...，告知上下标语音的大致得分；（6）众测用户开始听音打分，前三条语料的语音作为用户进入状态平稳打分标准的铺垫；（7）回收问卷，剔除出界次数较多的用户数据，统计MOS最终结果。

7.7K6 2

【AI专栏】语音合成系统评测介绍

作者：mekhidu 团队：腾讯移动品质中心 TMQ 前言语音合成（Text To Speech，TTS）技术将文本转化为声音，目前广泛应用于语音助手、智能音箱、地图导航等场景。...最好是能够邀请到有经验的听音专家来参与评分，听音专家从拟人性、连贯性、韵律感等方面对语音进行打分。...目前我们的评测是培训众测用户做为听音人，流程大致如下：（1）双方语音音量归一化；（2）语音字词发音准确性校验；（3）生成众测问卷，语音顺序交叉打乱；（4）众测用户培训，试听自然人声和较差合成音锚定打分标准...；（5）众测用户听音打分；（6）回收问卷，答题数据校验；（7）计算MOS得分。...[E5rah59.png] MOS打分表： [UScP8eE.jpg] 2、细分主观指标 MOS作为一个整体的主观打分可用于反映不同TTS合成的语音之间的差距，但是不适用于细致分析差异所在。

12.4K2 0

注意，有场景的公司正在拿起AI武器

2018年下半年开始，技术先发正在被产品、场景为王替代。之前，打造通用AI技术公司风头无两。如今，垂直化场景公司拿起AI武器，数据和场景加速转换为势能。今天要讲的是一桩在线教育领域的AI变革。...去年下半年，他们对外推出一款AI口语评测引擎，用于K12领域口语测评打分。之前，行业内有技术领域出发的先发产品，涵盖讯飞、思必驰、云知声和腾讯等玩家。...分数分布指的是口语评测引擎为样本打分的情况。分差分布代表的是引擎打分与人类专家打分的差。在分数分布上，一起教育科技的引擎在单词和句子上的打分，与其他各家更趋近人类专家的水平。 ? ?...可能性越高，发音就越准确。这个可能性，就是系统已知发音和未知发音的似然比（likelihood ratio）。似然比的计算，通常基于声学模型。...对于发音水平较好的学生，GOP算法能够给出一个相对准确的评估。但对于发音较差、中式英语痕迹很重的学生，其似然比区分度很低，这个算法就很难奏效。对于这个问题，一起教育科技采用两个解决办法。 ?

2K2 0

TTS系统评测方法介绍--WSRD AI评测实验室

语音合成（Text To Speech，TTS）技术将文本转化为声音，目前广泛应用于语音助手、智能音箱、地图导航等场景。...TTS的实现涉及到语言学、语音学的诸多复杂知识，因合成技术的区别，不同的TTS系统在准确性、自然度、清晰度、还原度等方面也有着不一样的表现，如何从多维度综合评价TTS系统质量成了TTS测试人员的一大挑战...因此我们将MOS评测与两两比较法相结合，并引入上标锚定打分标准，使结果相对稳定。...校验上述语音是否与语料内容一致，是否存在错误发音语音音量对齐生成众测问卷，被测TTS、对照TTS、声优三者语音交叉打乱开始任务前给听音人试听上标下标语音，告知上下标语音的大致得分众测用户开始听音打分...，前三条语料的语音作为用户进入状态平稳打分标准的铺垫回收问卷，剔除出界次数较多的用户数据，统计MOS最终结果

17.4K11 5

人工智能技术：人脸识别技术介绍

今天给大家介绍一下人脸识别相关的技术，希望对大家能有所帮助！一、人脸识别概念人脸识别，是基于人的脸部特征信息进行身份识别的一种生物识别技术。...所使用的核心技术主要有：2.2 人脸关键点及活体特征人脸关键点：也称为人脸关键点检测、定位或人脸对齐，根据人脸图像定位出人脸面部的关键区域（嘴巴、鼻子、眼睛、耳朵、脸部轮廓等等），其中根据72个关键点描述五官的位置来进行人脸跟踪

2.6K2 0

【人工智能】技术总结

标注：分类问题、目标检测、分割问题标注方式不一样谁来标注大企业：专门标注人员或团队中小企业：开发人员、技术团队自己标注有些数据需要专业知识才能进行标注 9）模型训练时间估算实际项目中采用增量训练...处理方式效果五、项目示例 1）芯片质检样本：芯片高清图像技术路线：OpenCV图像技术技术点：灰度处理、二值化、膨胀、轮廓检测、轮廓实心填充 2）胶囊质检样本：胶囊高清图像技术路线：OpenCV...图像技术技术点：灰度处理、二值化、膨胀、模糊、霍夫变换、像素计算、轮廓查找/绘制/面积周长计算 3）瓷砖瑕疵检测样本：1000多个瓷砖样本，包含7个类别（正常、空洞、裂缝、缺块、色板、刮痕、其它）

8982 0

腾讯教育智聆口语评测亮相微信公开课，英语好不好AI告诉你

“ 有来头：解读智聆口语评测的“前世今生” 智聆口语评测是由腾讯云团队基于微信“智聆”的技术与应用基础，创新算法研发而成的语音评测产品。...2013 AI语音识别技术就开始在微信、QQ、游戏、搜索等数十个产品中得以运用，并历经腾讯亿级用户的考验。...“3”即三大产品特性 1 首先，智聆口语评测支持从儿童到成人全年龄段覆盖的英语语音评测打分，并且针对儿童提供个性化、差异化的评测能力支持 2 其次，全方位打分机制，通过发音准确度、流利度、完整度等多维度解读...智聆口语评测的语音评测打分结果与专家打分拟合度 95% 以上，可广泛应用于英语口语类教学业务中 “5”指五种评测模式即通过单词、句子、段落、自由说、情景对话不同模式，重塑学习场景，深度渗透教、管、练...“小朋友在发音上经常会有多读、漏读等口语化的错误需要引导并纠正，如果直接用学习文本作为评测标准，会将无效的发音也包含在学习文本的发音中，从而造成较大的误差。

22.8K2 0

比起WE大会“救命的AI”，这个AI已经悄悄进入人们的学习中

上周末的腾讯WE大会上，中国脑计划领军人物、中科院神经科学研究所所长蒲慕明说到， “未来人工智能要进一步发展的话，就需从脑科学得到启发，包括机器学习过程，怎么从脑启发的这个概念来设计新的计算模式，新的类似人脑的神经元结构的器件...腾讯在“人工智能”+“医疗”领域，打造“救命的AI”。而这个“救命的AI”，已经开始早期筛选食管癌、糖尿病、视网膜病变、乳腺癌等病症，对700多种疾病风险进行预测诊断。...▽ 1 打分的标准是什么？...@技术支持回复@热心网友：1.0到4.0为婴幼儿到成年人的平滑划分，可以认为4.0就是一个完全具备标准发音的成年人说话的标准，1.0是可能刚刚掌握的婴幼儿水平。能够完整，标准的说清普通话则调用成人的。...根据使用者的发音标准调用对应的接口，接口不会区分使用者的岁数，只会根据发音标准拍判断。

6K4 0

人工智能成为在线教育的巨大机遇，51Talk如何抓住？

2017年人工智能成功接棒互联网与各行各业融合，作为互联网+最重要领域之一的在线教育，也在成为人工智能技术受益者。...口语学习需要发音示范、矫正发音、评测水平等等，十年前大家学英语人手一个复读机，就体现出了工具在英语学习尤其是听力和口语学习中的重要性。...现在，语音合成技术可以让机器更好地发音，语音识别技术可以让机器听懂用户，这一点正是语音技术起家的科大讯飞切入教育行业的逻辑，他们提供诸如普通话考试评测这样的服务，主要面向传统教育架构。...51Talk是在线教育平台中应用智能语音技术较多的平台，它利用语音识别技术，对学生英语口语的发音、流畅程度进行打分，再给出合理的改进方向；通过语义理解技术对学生知识点的掌握情况自动生成分析报告，让学生更好地了解学习情况...随着人工智能技术进一步普及，AI+教育还将碰撞出更多火花，推动在线教育模式创新、成为整个教育行业变革的机会。人工智能会取代老师教学吗？

2.6K10 0

腾讯教育云亮相中国教育装备展多项产品能力共建教育新生态

通过Ai技术能力和数字化内容能力，深度优化教学内容建设和教学效率，并依托腾讯云底层能力为在线教育客户提供优质的云资源支持。...1 智聆口语评测关键词单词评分句子评分多维度打分聚焦英语口语类教学业务，腾讯云联合微信智聆团队研发出“智聆口语评测”产品，支持从儿童到成人全年龄覆盖的口语打分，能够从发音准确度、流利度、完整度...、重音准确度等维度对单词、句子进行全方位打分，帮助学生矫正发音。...智聆口语评测有效解决了过去只能依赖专业教师听后进行主观评估，成本高、学习时间难以保证的问题，并且打分结果与专家打分相似度在95%以上。企业或学校可通过调用标准的API技术接口，实现口语评分的能力。...在课后辅导方面，“智能作业批改”针对小学速算作业批改场景，通过人工智能和腾讯优图的图像处理技术，实现智能化批改作业，帮助教师避免大量基础性、重复性的批改工作，将精力集中在教学上。

4.5K3 1

点击加载更多

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭