8月27日消息,美国当地时间周二,谷歌为其翻译应用引入了两项由Gemini AI驱动的重要新功能,对“实时翻译”功能进行了全面增强,让跨语言对话更加自然流畅。
此外,新增的“练习”功能可提供个性化语言学习体验,直接向Duolingo等语言学习服务平台发起挑战。目前该功能已开始在Android和iOS平台陆续上线,这无疑是谷歌在日益激烈的AI竞争中放出的又一记大招。
此次更新致力于让跨语言沟通和教育变得更加直观,也表明谷歌正在对其这款广受欢迎但近年来略显沉寂的应用投入重资。
实时对话无障碍:AI翻译实现自然交流
此次升级的核心亮点是全新的“实时翻译”功能。与传统翻译模式不同,基于Gemini先进模型,该系统能够智能识别对话中的停顿、口音和语调,实现真正的双向流畅交流。
谷歌实时翻译功能,将西班牙语实时翻译成英语
使用体验简单直观:用户只需轻点一次选择语言,即可开始自然对话。应用会同步提供语音翻译和实时字幕,方便用户随时确认翻译的准确性。
这一技术突破得益于谷歌最新的语音识别模型,该模型经过专门训练,能有效区分不同说话人的声音。这一功能在机场、咖啡馆等嘈杂环境中显得尤为实用。
通过自动识别说话人并在两种语言间无缝切换,该功能成功消除了传统翻译工具的交流障碍,让对话更富人性化。目前支持阿拉伯语、法语、印地语和西班牙语等70多种语言,首批在美国、印度和墨西哥的Android和iOS用户中推出。
语言学习新选择:个性化练习挑战Duolingo
本次更新中最具野心的当属“练习”功能,这标志着谷歌正式进军语言学习领域。该功能针对学习者最难掌握的口语能力,根据用户目标和语言水平生成个性化听说练习。
谷歌语言学习练习功能,用户既可以聆听对话并通过点选听到的词汇来提升理解能力,也可以随时借助智能提示进行口语训练
使用过程充满个性化:用户只需选择自己的语言水平和学习目标,AI便会根据实际表现智能生成互动练习场景。这些练习包括听力模式,用户通过点击他们听到的单词来提高理解能力;还有口语模式,提供有用的提示,鼓励用户进行口语练习。
通过将这一功能集成到用户基数庞大的免费应用中,谷歌向现有竞争者发起了强劲挑战。练习功能与实时翻译相结合,有望吸引大量语言学习者。
AI翻译赛道竞争白热化
谷歌翻译此次更新是科技巨头在AI沟通领域的最新动作。就在几周前,Meta刚为Instagram和Facebook Reels推出了AI配音和口型同步工具。
微软也是重要竞争者,早在2024年底就推出了“Interpreter in Teams” 功能,提供实时翻译的同时还能模拟用户声音。
谷歌自身也在多线作战,此前已为Google Meet推出了Gemini驱动的实时翻译功能,能够保留声音的细微特征。
与此同时,专业公司DeepL在2024年11月推出了自己的实时翻译服务,通过专注于文本字幕确保最低延迟,充分发挥其准确度优势。
质量升级正当时:AI翻译迎来关键时刻
此次翻译功能扩展正值谷歌AI声誉的关键时期。就在上个月,Gmail曾出现重大故障,AI错误翻译德语电子邮件导致严重内容问题。这一缺陷最早由德国媒体曝光,离奇的错误严重影响了翻译可信度。
这一事件加深了市场对AI“幻觉”问题的普遍担忧,即模型生成的信息看似可信实则错误的情况。对谷歌而言,本次翻译功能更新不仅是产品发布,更是展示AI实用性和可靠性的重要机会。
通过推出这项复杂且以用户为中心的更新,谷歌有意展示其AI技术实力。成败关键将取决于这些工具的实际表现,特别是在近期Gmail问题暴露缺陷的背景下。(文/腾讯科技特约编译金鹿,编辑/郑萌萌)