首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

实时对话更自然,OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式

【ITBEAR科技资讯】7月31日消息,OpenAI于当地时间30日宣布,即日起GPT-4o的语音模式(注:Alpha版本)将对部分ChatGPT Plus用户开放,计划在今年秋季将该功能逐步推广至所有ChatGPT Plus订阅用户。

据ITBEAR科技资讯了解,OpenAI首席技术官米拉・穆拉蒂(Mira Murati)在早前的演讲中阐述了GPT-4o的技术特点。她指出,GPT-4o是一个全新的跨文本、视觉和音频的端到端统一模型,其特色在于所有的输入与输出都由单一的神经网络负责处理。由于这是OpenAI首个融合多种模式的模型,因此在功能和局限性的探索上,他们还处于初步阶段。

原计划于今年6月底邀请小部分ChatGPT Plus用户测试GPT-4o语音模式的OpenAI,因需要更多时间来完善模型并提升其特定内容的检测和拒绝能力,故官方在6月宣布了测试推迟的消息。

早期信息显示,相较于GPT-3.5模型2.8秒的平均语音反馈延迟,GPT-4的5.4秒延迟在语音交互上显得不足。然而,新一代的GPT-4o预计将大幅降低这一延迟,实现更为流畅的对话体验。

GPT-4o语音模式的亮点在于其迅速的反应速度和高度逼真的声音。OpenAI更是声称,该模式能够感知语音中的情感语调,包括悲伤、兴奋甚至是歌唱。

OpenAI 发言人林赛・麦卡勒姆(Lindsay McCallum)明确表示:“ChatGPT不会冒充他人的声音,无论是个人还是公众人物,且系统会阻止与预设声音不符的输出。”这一声明为GPT-4o在语音交互的真实性和安全性上提供了保障。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Oacxf8QCFSikOjLPaBy-8WhQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券