Meta推出“无缝沟通”AI翻译模型，带来更自然的跨语言对话体验

文章来源：企鹅号 - IT之家

IT之家 12 月 4 日消息，今年 8 月，Meta 公司推出了其多模态人工智能翻译模型 SeamlessM4T，该模型支持近 100 种语言的文本和 36 种语言的语音。现在该模型更新了“v2”架构，Meta 将其称之为“Seamless Communication（无缝沟通）”模型，能够让对话翻译更加自然和富有表现力。

两个新功能中的第一个是“SeamlessExpressive”，顾名思义，该功能可以将你的语气转移到翻译后的语音中，包括音调、音量、情感色彩（兴奋、悲伤或低语）、语速和停顿。考虑到目前翻译后的语音一般听起来都很机械，这一突破还是非常值得期待的，无论是在我们的日常生活中还是在内容制作中，都有很大的帮助。目前其支持的语言包括英语、西班牙语、德语、法语、意大利语和中文，不过在IT之家撰写本文时，演示页面缺少意大利语和中文。

第二个功能是“SeamlessStreaming”，可以在说话者仍在讲话时开始翻译，从而让其他人更快地听到翻译。虽然仍有不到两秒钟的短暂延迟，但至少不必等到对方说完一个句子。据 Meta 公司称，最大的挑战在于不同语言有不同的句子结构，因此他们必须开发一个专门的算法来研究部分音频输入，以决定是否有足够的上下文开始生成翻译输出，或者是否继续倾听。

IT之家注意到，目前 Meta 还没有透露公众何时能够使用这些新功能，但可以期待未来 Meta 将它们集成到其智能眼镜中，使其更加实用。

发表于: 2023-12-042023-12-04 14:11:23
原文链接：https://page.om.qq.com/page/ObbHxNA0yrr8H9LTNP61ifZQ0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

Meta推出“无缝沟通”AI翻译模型，带来更自然的跨语言对话体验

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐