某中心推出的英语学习功能采用先进的语音识别技术,通过 phonetic RNN-transducer 模型预测学习者发音中的音素(语音最小单位)。该模型能够提供细粒度的发音评估,包括单词、音节或音素级别的错误检测。
实验显示,使用增强数据训练的模型在错误发音检测准确率上比基线模型提升达5%。
相关技术论文发表于ICASSP 2023会议,详细方法参见《Phonetic RNN-transducer for mispronunciation diagnosis》
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。