首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

活动报名|Meta语音识别,正确率显著提升,零样本跨语言MMS Zero-shot

报告日期:09月11日(周三)10:30-11:30

尽管自动语音识别(ASR)在语言覆盖方面取得了重大进展,但仍有许多语言未被覆盖。为了解决这一问题,我们提出了 MMS Zero-shot,这是一种简单的使用罗马化(romanization)而非复杂的音素化的方法。我们首先在包含1078种语言的标注数据集上训练了一个多语言的声学模型(acoustic model),然后在测试阶段,只需要很少量的未标记文本,就可以实现在任何未见过的语言上进行语音识别。这种方法将100种以前未见过的评估语言的平均字符错误率降低了46%,性能远超以往的零样本方法。MMS Zero-shot 在评估语言上的错误率仅为监督模型的2.5倍。本文探讨了 MMS Zero-shot 如何将自动语音识别技术推广到任何语言。

赵锦铭,澳大利亚莫纳什大学博士生,该项目是她在Meta(Fair)实习期间完成。她的研究重点是语音翻译和识别,其研究成果已在顶级NLP/语音会议上发表。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/ONC0gWcHyOkQOzHZdm40keNA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券