OpenAI 推出 Flex 处理机制,助力成本更低但响应较慢的 AI 任务

360影视 国产动漫 2025-04-21 21:47 2

摘要:为了更积极地与 Google 等竞争对手抗衡,OpenAI 正在推出 Flex processing,这是一种 API 选项,通过降低 AI 模型的使用价格换取响应速度变慢以及“偶尔出现资源不可用”的情况。

为了更积极地与 Google 等竞争对手抗衡,OpenAI 正在推出 Flex processing,这是一种 API 选项,通过降低 AI 模型的使用价格换取响应速度变慢以及“偶尔出现资源不可用”的情况。

OpenAI 表示,Flex processing 目前以 Beta 版本的形式适用于其近期发布的 o3 和 o4-mini 推理模型,并主要面向较低优先级以及“非生产”任务,例如模型评估、数据丰富以及异步工作负载。

该机制将 API 成本精确降低了 50%。对于 o3 而言,Flex processing 的定价为每百万输入 Token 5 美元(约 750,000 字)和每百万输出 Token 20 美元,而标准定价为每百万输入 Token 10 美元和每百万输出 Token 40 美元。对于 o4-mini,Flex 将价格降至每百万输入 Token 0.55 美元和每百万输出 Token 2.20 美元,相比之下标准价格分别为每百万输入 Token 1.10 美元和每百万输出 Token 4.40 美元。

Flex processing 的推出正值前沿 AI 成本持续攀升之时,同时竞争对手也推出了更便宜且更高效、面向预算用户的模型。上周四,Google 推出了 Gemini 2.5 Flash,这是一款推理模型,在性能上可以匹配甚至超越 DeepSeek 的 R1,同时具备更低的每百万输入 Token 成本。

在宣布 Flex 定价的电子邮件中,OpenAI 还指出,处于其使用层级体系中第 1 至第 3 层的开发者必须完成新引入的身份验证流程后才能访问 o3。 (Tiers are determined by the amount of money spent on OpenAI services. ) 此外,o3 及其他模型的推理摘要和流式 API 支持也需要通过身份验证才能使用。

OpenAI 先前曾表示,引入身份验证流程旨在阻止不法分子违反其使用政策。

来源:新浪财经

相关推荐