摘要:这些工具是 OpenAI 新 Responses API 的一部分,该 API 允许企业开发自定义 AI 代理,可以执行网络搜索、扫描公司文件和浏览网站,就像OpenAI 的 Operator 产品一样。Responses API 有效地取代了 OpenAI
3月12日,周二,OpenAI 发布了新工具,旨在帮助开发人员和企业使用该公司自己的 AI 模型和框架构建 AI 代理——可以独立完成任务的自动化系统。
这些工具是 OpenAI 新 Responses API 的一部分,该 API 允许企业开发自定义 AI 代理,可以执行网络搜索、扫描公司文件和浏览网站,就像OpenAI 的 Operator 产品一样。Responses API 有效地取代了 OpenAI 的Assistants API,该公司计划在 2026 年上半年停止使用 Assistants API。
近年来,尽管科技行业一直难以向人们展示甚至定义人工智能代理到底是什么,但围绕人工智能代理的炒作却急剧增加。
代理炒作超过实用性的最新例子是中国初创公司 Butterfly Effect 本周早些时候推出的一款名为 Manus 的新型人工智能代理平台在网上走红,但用户很快发现该公司的许多承诺并未兑现。
换句话说,对于 OpenAI 来说,让代理正确运行的风险很高。
OpenAI 的 API 产品负责人 Olivier Godement 在接受 TechCrunch 采访时表示:演示代理非常容易。但扩展代理非常困难,让人们经常使用它也非常困难。
今年早些时候,OpenAI 在ChatGPT中引入了两个 AI 代理:Operator(代表您浏览网站)和Deep Research(为您编制研究报告)。这两种工具都让我们看到了代理技术可以实现的功能,但在自主性方面还有很大的改进空间。
现在,借助 Responses API,OpenAI 希望出售支持 AI 代理的组件的访问权限,从而让开发人员能够构建自己的 Operator 和深度研究风格的代理应用程序。OpenAI 希望开发人员能够利用其代理技术创建一些比目前可用的应用程序更自主的应用程序。
使用 Responses API,开发人员可以利用 OpenAI 的ChatGPT Search网络搜索工具中的相同 AI 模型(预览版):GPT-4o 搜索和 GPT-4o 迷你搜索。这些模型可以浏览网络以查找问题的答案,并在生成回复时引用来源。
OpenAI 声称 GPT-4o 搜索和 GPT-4o mini 搜索在事实方面非常准确。在该公司的 SimpleQA 基准测试中,该基准测试衡量模型回答简短、寻求事实的问题的能力,GPT-4o 搜索得分为 90%,而 GPT-4o mini 搜索得分为 88%(越高越好)。相比之下,GPT-4.5(OpenAI 最近发布的更大模型)得分仅为 63%。
Responses API 还包含一个文件搜索实用程序,可以快速扫描公司数据库中的文件以检索信息。(OpenAI 声称不会在这些文件上训练模型。)此外,使用 Responses API 的开发人员可以利用 OpenAI 的计算机使用代理 (CUA) 模型,该模型为 Operator 提供支持。该模型会生成鼠标和键盘操作,使开发人员能够自动执行数据输入和应用程序工作流等计算机使用任务。
OpenAI 表示,企业可以选择在自己的系统上本地运行以研究预览形式发布的 CUA 模型。Operator 中提供的 CUA 消费者版本只能在网络上采取行动。
需要明确的是,Responses API 并不能解决当今困扰 AI 代理的所有技术问题。
虽然人工智能搜索工具比传统人工智能模型更准确(这一事实并不令人惊讶,因为它们可以查找正确答案),但网络搜索并不能解决人工智能幻觉问题。GPT-4o 搜索仍然会错误回答 10% 的事实问题。除了准确性之外,人工智能搜索工具在处理简短的导航查询(例如“湖人队今天的得分”)时也往往遇到困难,最近的报告表明ChatGPT 的引用并不总是可靠的。
OpenAI 在向 TechCrunch 提供的一篇博客文章中表示,CUA 模型“对于在操作系统上自动执行任务而言还不够可靠”,而且容易犯“无意”的错误。
然而,OpenAI 表示,这些是其代理工具的早期版本,并且正在不断努力改进它们。
除了 Responses API,OpenAI 还发布了一个名为 Agents SDK 的开源工具包,它为开发人员提供免费工具,用于将模型与内部系统集成、实施保护措施以及监控 AI 代理活动以进行调试和优化。Agents SDK 是 OpenAI Swarm 的后续产品,Swarm 是该公司去年年底发布的多代理编排框架。
Godement 表示,他希望 OpenAI 今年能够缩小 AI 代理演示与产品之间的差距,并且,在他看来,代理是未来最具影响力的 AI 应用。
这与 OpenAI 首席执行官 Sam Altman 一月份的宣言相呼应:2025 年是 AI 代理进入劳动力市场的一年。
无论 2025 年是否真正成为人工智能代理年,OpenAI 的最新版本都表明该公司希望从华而不实的代理演示转向有影响力的工具。
来源:鞭牛士