首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

OpenAI推出新一代语音模型 重点提升复杂环境识别和处理能力

【太平洋科技快讯】近日,OpenAI宣布推出一系列创新的语音模型,包括gpt-4o-transcribe、gpt-4o-mini-transcribe和gpt-4o-mini-tts,这些模型在语音识别和处理方面取得了显著突破。

OpenAI此次推出的gpt-4o-mini模型,以其高性价比和强大功能脱颖而出。该模型在成本上较GPT-4o降低了96%至97%,同时比GPT-3.5 Turbo便宜60%至70%。据悉,gpt-4o-mini的API价格定为15美分/100万Tokens输入和60美分/100万Tokens输出,为开发者提供了更为经济实惠的选择。

GPT-4o模型具备处理50种不同语言的能力,大大提高了语音识别的适用范围。此外,该模型在响应速度和质量上均有显著提升,能在最短232毫秒内对音频输入做出反应,接近人类对话反应时间。GPT-4o还能读取人的情绪,使得人机交互更加自然和流畅。

新推出的语音模型在语音转文本(STT)方面表现出色,尤其在口音适应、嘈杂环境处理以及不同语速识别方面优于现有解决方案。这使得模型在呼叫中心、会议记录等场景中更具实用性。同时,文本转语音(TTS)模型允许开发者设定语音风格,如模拟富有同理心的客户服务代表,提供更具表现力和温度的语音体验。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OrGbBWbHVG-FyHUptBe6FPfw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券