首页
学习
活动
专区
圈层
工具
发布

OpenAI 推出 Flex 处理机制,助力成本更低但响应较慢的 AI 任务

为了更积极地与 Google 等竞争对手抗衡,OpenAI 正在推出 Flex processing,这是一种 API 选项,通过降低 AI 模型的使用价格换取响应速度变慢以及“偶尔出现资源不可用”的情况。

OpenAI 表示,Flex processing 目前以 Beta 版本的形式适用于其近期发布的 o3 和 o4-mini 推理模型,并主要面向较低优先级以及“非生产”任务,例如模型评估、数据丰富以及异步工作负载。

该机制将 API 成本精确降低了 50%。对于 o3 而言,Flex processing 的定价为每百万输入 Token 5 美元(约 750,000 字)和每百万输出 Token 20 美元,而标准定价为每百万输入 Token 10 美元和每百万输出 Token 40 美元。对于 o4-mini,Flex 将价格降至每百万输入 Token 0.55 美元和每百万输出 Token 2.20 美元,相比之下标准价格分别为每百万输入 Token 1.10 美元和每百万输出 Token 4.40 美元。

Flex processing 的推出正值前沿 AI 成本持续攀升之时,同时竞争对手也推出了更便宜且更高效、面向预算用户的模型。上周四,Google 推出了 Gemini 2.5 Flash,这是一款推理模型,在性能上可以匹配甚至超越 DeepSeek 的 R1,同时具备更低的每百万输入 Token 成本。

在宣布 Flex 定价的电子邮件中,OpenAI 还指出,处于其使用层级体系中第 1 至第 3 层的开发者必须完成新引入的身份验证流程后才能访问 o3。 (Tiers are determined by the amount of money spent on OpenAI services. ) 此外,o3 及其他模型的推理摘要和流式 API 支持也需要通过身份验证才能使用。

OpenAI 先前曾表示,引入身份验证流程旨在阻止不法分子违反其使用政策。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/ORCPlQbn2gA6GrDxfitEIA8w0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券