OpenAI 推出 Flex 处理机制，助力成本更低但响应较慢的 AI 任务

摘要：为了更积极地与 Google 等竞争对手抗衡，OpenAI 正在推出 Flex processing，这是一种 API 选项，通过降低 AI 模型的使用价格换取响应速度变慢以及“偶尔出现资源不可用”的情况。

为了更积极地与 Google 等竞争对手抗衡，OpenAI 正在推出 Flex processing，这是一种 API 选项，通过降低 AI 模型的使用价格换取响应速度变慢以及“偶尔出现资源不可用”的情况。

OpenAI 表示，Flex processing 目前以 Beta 版本的形式适用于其近期发布的 o3 和 o4-mini 推理模型，并主要面向较低优先级以及“非生产”任务，例如模型评估、数据丰富以及异步工作负载。

该机制将 API 成本精确降低了 50%。对于 o3 而言，Flex processing 的定价为每百万输入 Token 5 美元（约 750,000 字）和每百万输出 Token 20 美元，而标准定价为每百万输入 Token 10 美元和每百万输出 Token 40 美元。对于 o4-mini，Flex 将价格降至每百万输入 Token 0.55 美元和每百万输出 Token 2.20 美元，相比之下标准价格分别为每百万输入 Token 1.10 美元和每百万输出 Token 4.40 美元。

Flex processing 的推出正值前沿 AI 成本持续攀升之时，同时竞争对手也推出了更便宜且更高效、面向预算用户的模型。上周四，Google 推出了 Gemini 2.5 Flash，这是一款推理模型，在性能上可以匹配甚至超越 DeepSeek 的 R1，同时具备更低的每百万输入 Token 成本。

在宣布 Flex 定价的电子邮件中，OpenAI 还指出，处于其使用层级体系中第 1 至第 3 层的开发者必须完成新引入的身份验证流程后才能访问 o3。 (Tiers are determined by the amount of money spent on OpenAI services. ) 此外，o3 及其他模型的推理摘要和流式 API 支持也需要通过身份验证才能使用。

OpenAI 先前曾表示，引入身份验证流程旨在阻止不法分子违反其使用政策。

来源：新浪财经

标签： openai flex a processing token

本文地址：https://news.43u.com.cn/a/1323851.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!