首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Meta为AR/VR虚拟平台研发语音助手,可翻译/识别128种语言

近期,Meta旗下的AI科研团队公布了一种自监督学习的语音处理方案XLS-$,其特点是可识别128种语言,实现语音识别、语言识别、语音翻译等功能。据悉,Meta希望将语音识别技术与未来的虚拟技术结合,其表示:交谈是人与人互动的自然方式,而语音技术可以让我们与设备和虚拟系统互动,让虚拟体验与物理世界更加融为一体。

据青亭网了解,Meta号称训练XLS-R采用的公共数据是其他语言模型的近10倍,它可以识别的语言类型也是其他模型的两倍多。细节方面,训练XLS-R的数据包括43.6万小时的公开演讲录音,涉及有声读物、议会程序等各种内容。

此外,Meta根据4大多语言语音识别准对XLS-R进行评估,经过测试37种语言识别,发现XLS-R的表现优于此前的方案。而经过微调后,XLS-R可以在英语和21种其他语言之间实时语音互译。

Meta表示:我们发现,最大的语音模型包含20亿个参数,与规模更小的模型相比,大规模模型的效果更好,因为参数越多意味着包含更多种语言的数据,训练效果更充分。目前,XLS-R翻译法语、德语的准确性更高,其次是俄语、葡萄牙语等等。未来,Meta计划让XLR-R支持7000多种语言。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20211124A041BT00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券