首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

同声传译新突破!谷歌 Translatotron 3 模型:可绕过文本转换步骤

12 月 2 日,谷歌公司在今天的新闻发布会上,正式向外界发布了一款名为“Translatotron 3”的全新的人工智能模型。该模型的推出,标志着谷歌公司在人工智能语音翻译领域的一项重要突破。据悉,这款全新的人工智能模型,无需任何并行语音数据下,就能够实现语音对语音的同声传译翻译,从而大大提高了人工智能语音翻译的速度和准确性。

早在 2019 年,谷歌公司就推出了第一代“Translatotron S2ST”系统。经过不断的技术改进和优化,在 2021 年 7 月,谷歌公司又推出了“Translatotron S2ST”系统的第二代版本。在 2023 年 5 月 27 日,谷歌公司发布了一篇论文,宣布正在部署一种全新的训练方法,用以训练这款全新的“Translatotron 3”模型。

据研究人员介绍,“Translatotron 2”模型已经在翻译质量、语音鲁棒性(Robust)和语音自然度等方面,取得了非常优秀的表现。而“Translatotron 3”模型则是谷歌公司在人工智能语音翻译领域的又一次重大突破,实现了“第一个完全无监督直接语音到语音翻译的端对端模型”。

传统上的“S2ST”系统,主要是通过自动语音识别 + 机器翻译 + 文本到语音合成的级联方法来解决语音翻译问题的。然而,“Translatotron 3”模型则是依赖一种全新的端对端架构,直接将源语言语音映射到目标语言,而不依赖中间文本表示,从而实现了更快的速度和更高的准确性。

研究人员表示,“Translatotron 3”模型不仅可以用于语音翻译,还可以用于创建帮助有语言障碍的人的工具,或者开发更具吸引力和有效性的个性化语言学习工具,为广大用户带来更加便捷、高效的语言学习体验。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Olv2vU9ahrczVYNKIlqjX_hg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券