跨物种交流成为可能！谷歌AI研究室实现初步与海豚的语言沟通！

文章来源：企鹅号 - 玩酷推荐

谷歌旗下的 AI 研究实验室谷歌 DeepMind 近日宣布，成功开发出一款名为 DolphinGemma 的 AI 模型，根据谷歌的介绍，未来通过AI技术与海豚交流逐渐成为了可能。

DolphinGemma 是谷歌 DeepMind 于 2025 年 4 月 15 日宣布开发成功的一款 AI 模型。它基于谷歌开放的 Gemma 系列模型构建，DolphinGemma基于与谷歌Gemini系统相同的技术构建，拥有约4亿个参数，其运作方式与ChatGPT等生成式语言模型类似，但生成的是海豚声音而非文字。

目前的研究方向是让DolphinGemma在听完海豚声音的“前半部分”后，由AI生成“后半部分”，并比对AI生成的后半部分与海豚实际发出的后半部分是否一致，以初步判断“海豚语”是否有固定的单词或结构。

技术原理：使用了谷歌独特的音频技术，其中 SoundStream 分词器能快速把海豚声音变成计算机能理解的信号，随后由适合处理复杂序列的模型架构进行处理。

从目前的研究来看，海豚之间不仅存在他们种族的“语言”而且这种语言的沟通方式还可能与人类能实现跨物种交流。这是因为海豚的“语言”和人类语言高度接近。

一项发表在《皇家社会生物学通讯》的研究表明，海豚相互间交流的方式近乎于人类。

当一些海豚发出像吹口哨一样的声音时，这些声音是由特定组织震动发出的，其运作原理类似于人类和许多陆生生物的声带振动。

‌声音类型划分‌

海豚主要使用三种声音进行交流：

‌哨声（Whistles）‌：用于群体间情感传递与个体识别，类似人类“姓名”。研究显示不同哨声组合可表达情绪变化（如兴奋时频率升高）。

‌脉冲声（Burst-pulsed sounds）‌：构成“单词”级信息单元，通过排列组合形成完整“语句”，科学家已观测到包含5个“词汇”的句子结构。

‌滴答声（Clicks）‌：主要用于回声定位，通过发射

f=120−130kHzf=120−130 kHz 的超声波探测环境，精度可达70米距离内识别2.5厘米物体。

‌声纳系统的精妙设计‌，前额超声波发射器可聚焦信号，对特定区域进行高清探测。群体活动中采用避让机制，同类声纳信号互不干扰，实现集群协作。

彼得·麦德森曾表示：

实际上，它们是通过鼻腔中结缔组织的共振频率来发声的，而且它们能随意调节肌肉紧张度和通过的气流。这和人类用声带说话时做的一模一样。和海豚类似，事实上谷歌2024年9月还推出了一款鲸鱼声音识别模型，它能够识别出八种鲸鱼的独特叫声，并精细区分其中两种鲸鱼的不同发声类型。

而鲸鱼也和海豚一样，其语言和人类语言也具有相似性。

今年年初发表在《科学》杂志上的一项研究惊奇地发现，通过模仿儿童学习语言的过程，鲸鱼的歌声与人类使用的语言存在统计相似性。

更好地理解海豚的沟通方式。例如，母海豚在团聚时常用的标志性口哨声，以及在战斗中发出的脉冲 “尖叫声”，还有在求偶或追逐鲨鱼时使用的 “嗡嗡” 声，DolphinGemma 能够捕捉和解读这些不同声音，将声音与行为情境相结合。

WDP 计划在 2025 年夏季使用新款 Pixel 9 搭建一个集声音合成与监听于一体的海豚沟通研究平台，使研究人员能够实时聆听海豚发出的声音，并生成相应的 “回应”，从而极大提升研究的效率与准确性。

NatureLM 模型在揭开动物语言的神秘面纱之路上，再一次递进一步，让人们更接近理解大自然的真实面貌，帮助人们识别动物的种类、年龄以及它们发出的信号是痛苦还是游戏等。

发表于: 2025-04-172025-04-17 09:03:37
原文链接：https://page.om.qq.com/page/OQgWsNvaQZfaCRZTkJ6UVFsQ0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

跨物种交流成为可能！谷歌AI研究室实现初步与海豚的语言沟通！

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐