首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

法国AI实验室Kyutai发布GPT-4o的开源平替音频多模态模型Moshi

法国独立非盈利AI研究实验室Kyutai推出了具备70种情绪的语音助手Moshi,被视为GPT-4的新挑战者。此次在巴黎的演示显示,Moshi不仅具备多模态交互能力,还能实时生成具有情绪变化的语音,开创性地实现了语音AI的全新应用。

Moshi的开发团队由Kyutai的八位研究人员组成,他们在六个月内从零开始打造出这款创新产品。Moshi不仅能够模拟人类的情绪,进行丰富多变的对话,还能在不同语境下展现出相应的风格,如用浓重的法国口音朗诵诗歌。此外,Moshi的功能还包括实时响应和低延迟交互,使其在实时应用场景中,如客户服务或实时翻译,表现出色。

Kyutai表示,Moshi的研发旨在为AI开放研究及其生态系统的发展贡献力量。未来几周,Moshi的模型代码、权重以及相关研究将被公开发布,这在同类技术中也是前所未有的。此举不仅展示了Kyutai对于科技开放和共享的承诺,也预示着这种技术的潜力,可能彻底改变我们与数字世界中的AI交流方式。

与此同时,Moshi的问世对OpenAI构成了直接挑战。OpenAI原本计划在其ChatGPT平台上推出类似的语音助手功能,但由于安全顾虑,发布已被推迟。Kyutai的快速动作在业界引起了广泛关注,许多人认为这标志着一个新的竞争阶段的开始。

Kyutai获得了欧洲实业资本等多方面的支持,包括法国亿万富翁Xavier Niel的投资。这不仅为Kyutai提供了坚实的资金支持,还强化了其在全球AI发展领域中的竞争地位。Kyutai CEO Patrick Pérez表示,他们相信Moshi将为用户提供前所未有的交互体验,使欧洲在全球AI领域中占据重要位置。

总的来说,Moshi的推出不仅是技术创新的胜利,也是对开放科技理念的一次有力支持。随着更多功能的加入和技术的完善,Moshi有望在不久的将来成为市场上的主导产品,重新定义用户与AI的互动方式。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OGR8NtfhFiCq2fAysvAmFphg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券