首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

本周知识局丨常见的7种语言数据标注异常分析

在语音数据标注的过程中,语音数据的有效性判定是至关重要的一步。有些是因为录制设备,有些是因为说话人的操作不规范,从而导致录制的语音出现异常现象。在数据标注过程中,需要对这些异常语音数据加以鉴别并挑选出来,保证标注数据的整洁性

今天就一起看看常见的集中语音数据异常现象

01丢帧

在语音录制过程中,由于音频设备的问题而表现出的发音卡顿,例如,语音段中某0.1秒内突然没有声音,0.1秒过后语音又恢复正常,此现象称为“丢帧”。它常出现于整句话的句中。此时,在做有效语音判定时该句话即被判定为无效语音

02切音

在语音录制过程中,由于过早结束或过晚开始录制而导致个别字被截断,从而表现出发音不完整,此现象称为“切音”。它常出现于整句话的句首或句尾,此时,在做有效语音判定时该句话即被判定为无效语音

03吞音

在说话人发音时,由于个别字的声母或韵母未完全发音而表现出的发音不完整,此现象称为“吞音”。它常出现于整句话的句中,此时,在做有效语音判定时该句话即被判定为无效语音

04喷麦

在说话人发音时,由于距离麦克凤太近而表现出的录入语音不清晰,听起来有明显“噗噗”的声音,此现象称为“喷麦”。喷麦声会产生非常强大的低频能量,从而损坏人声质量并影响声音的整体效果。它常出现于整句话中含有爆破音的位置,比如含有“p”“b”辅音的单词。此时,在做有效语音判定时该句话即被判定为无效语音

05重音

在说话人发音时,语音中出现两个或多个说话人,他们的音量大小相近且有大段重叠,无法分清主次,此现象称为“重音”。它常出现于整句话的句中,此时,在做有效语音判定时该句话即被判定为无效语音

06空旷音

在进行语音合成等研究时,往往对语音数据质量要求极高,特别是语音的声学场景。空间决定了声学场景,声学场景由需要识别的声音和不需要识别的声音组成。在实际生活中,经常会出现非常复杂的声学场景,空旷音是其中的一种

在录制过程中,由于周围环境较为空旷而表现出来的发音中带有回音,此现象称为“空旷音”。空旷音多发生在大会议宜或空中的房间里,回声会比较严重。它常出现于整句话的句中,此时,在做有效语音判定时该句话会被判定为无效语音

07混响

混响是一种常见的声学场景。与回声不同,混响是音源发出的原始语音(也称干声)经多次反射、折射后叠加而成的混合声音,在实际生活中,任何环境都会产生混响。在音乐厅或练歌房内,房间构造产生的混响效果会让音乐和歌声听起来更悦耳。而对语音识别、语音合成等语音研究来说,语音的清晰度则里为重要,因此,在做有效语音判定时含有明显混响的语音段被判定为无效语音

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20220530A033FA00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券