首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

“国内首个端到端通用语音 AI 大模型”心辰 Lingo 发布

IT之家 9 月 6 日消息,西湖心辰昨日发布了心辰 Lingo 语音大模型,号称是“国内首个端到端通用语音大模型”。

官方表示,针对心辰 Lingo 端到端语音大模型的能力,在多个领域和中文上进行增强,使得心辰 Lingo 的中文语音效果,相较 GPT-4o 更为出色。心辰 Lingo 于 8 月 24 日开启内测,至今已经有超千家企业用户预约测试。

相比较传统 TTS,端到端语音大模型则是一种更为全面的技术,不仅可以语音识别,还集成了自然语言处理、意图识别、对话管理以及语音合成等多个环节,实现了从语音输入到语音反馈的完整交互过程。

心辰 Lingo 语音模型技术能力上具备以下三个特点:

原生的语音理解:能够识别语音中的文字信息与其他重要特征,如情感、语气、音调等

多种语音风格表达:可以根据上下文和用户指令,自适应调整语音的速度、高低、噪声强度,并能够生成对话、歌唱、相声等多种风格的语音响应

语音模态超级压缩:采用具有数百倍压缩率的语音编解码器,降低计算和存储成本

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OZO5XKr6v04_UPjK3iUrTNow0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券