首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

OpenAI向部分用户开放GPT-4o语音模式,今年秋季将覆盖所有付费用户

多知8月1日消息,OpenAI宣布向部分ChatGPT Plus用户推出高级语音模式,并计划于秋季向所有ChatGPT Plus用户开放。新的音频功能将允许用户与ChatGPT对话并立即接收实时响应,也可以在ChatGPT说话时打断它,同时语音模式可分辨不同的语音语调所传达的信息。

使用过程中,它的声音会听起来更自然,并利用声音传达各种不同情绪。OpenAI还透露,GPT-4o可以感知用户声音中的情绪语调,包括悲伤、兴奋或者唱歌。

目前GPT-4o语音模式可使用四种预设声音,Juniper、Breeze、Cove和Ember,这些声音是与付费配音演员合作制作的。

新的语音模式由OpenAI的GPT-4o模型提供支持,该模型结合了语音、文本和视觉功能。

为了收集反馈,OpenAI最初向ChatGPT Plus的“一小部分用户”推出语音高级功能,但OpenAI表示,将在今年秋天向所有ChatGPT Plus用户开放。OpenAI将语音通话体验的推出时间从6月下旬推迟到7月,称需要时间达到发布标准。

目前,Alpha组的用户将在ChatGPT中收到提醒,并将收到一封邮件介绍如何使用

OpenAI也表示,已采用过滤器识别和阻止生成音乐或其他受版权保护的音频的请求,并将文本模型中使用的相同安全机制应用于GPT-4o,防止其违反法律,产生有害内容——“我们设置了护栏来阻止对暴力或受版权保护内容的请求。”

另据了解,视频和屏幕共享等更高级功能将在晚些时候推出。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OMEUyxNPaTEdq-K-mvcjDztw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券