摘要:在科技界的一次重大突破中,OpenAI于今日凌晨震撼发布了其全新的Agent开发套件,这一消息迅速在开发者社群中掀起了轩然大波。对于那些因缺少Manus邀请码而倍感焦虑的用户而言,这一发布无疑带来了曙光,因为自主打造Manus的日子似乎已不再遥远。
在科技界的一次重大突破中,OpenAI于今日凌晨震撼发布了其全新的Agent开发套件,这一消息迅速在开发者社群中掀起了轩然大波。对于那些因缺少Manus邀请码而倍感焦虑的用户而言,这一发布无疑带来了曙光,因为自主打造Manus的日子似乎已不再遥远。
本次发布的核心亮点不胜枚举,让我们逐一剖析。首先,Responses API作为Chat API的升级版,不仅完美兼容旧版API,更引入了多项新功能,如网页搜索、文件搜索及计算机使用能力(CUA)。这一API以其简洁而强大的设计,内置了多项工具,为开发者提供了直观清晰的操作体验。值得注意的是,OpenAI此前曾推出过一个用于Agent开发的API,但因其高昂的价格和不尽如人意的性能而饱受诟病,如今这款新API的问世,标志着OpenAI在Agent开发领域迈出了坚实的一步。
紧接着,OpenAI的API终于迎来了搜索功能的加入,这无疑为开发者提供了极大的便利。用户可以根据需求配置国家、时区、搜索量等参数,虽然价格相较于Google和Bing搜索略显昂贵,但考虑到其强大的功能和灵活性,这一价格似乎也在情理之中。具体而言,Google Search的价格为5美元1000次,Bing Search为20美元1000次,而OpenAI的搜索服务则从最便宜的25美元1000次到最贵的50美元1000次不等。
在文件搜索方面,OpenAI也进行了重要更新,如今已支持包括.pdf、.docx、.pptx等在内的21种文件格式,价格也相对亲民,调用1000次仅需2.5美元,而存储1GB数据每天也只需0.1美元。这一功能的加入,无疑为开发者在处理大量文档时提供了极大的便利。
CUA(Computer Use Agent)功能的推出,更是将AI的自动化能力推向了一个新的高度。通过截图界面理解并执行交互操作,CUA能够识别鼠标单击、双击、滚动、坐标、路径等多种行为,并自动执行相应的操作。这一功能的实现,使得AI能够像人类一样操作电脑,为自动化办公和智能生活带来了无限可能。目前,GitHub上已有相关项目上线,感兴趣的开发者可以前往尝试。
最后,但同样重要的是,OpenAI还推出了开源的Agent SDK,这一框架支持multi-agent系统构建,只要符合OpenAI Chat Completions API的模型均可使用。这意味着,像DeepSeek这样的模型也能轻松接入,为开发者提供了广阔的想象空间。对于普通用户而言,虽然这次发布会的内容可能显得有些“高大上”,但Agent套件的发布无疑将深刻改变我们的日常生活。或许在不久的将来,我们都能享受到智能体带来的便捷服务。
来源:ITBear科技资讯