OpenAI具推理能力的模型o3-mini正式推出

360影视 2025-02-03 19:13 2

摘要:继两周前首席执行官Sam Altman预告,OpenAI上周宣布具推理能力的小型AI模型OpenAI o3-mini,已部署到ChatGPT及API供付费方案用户及开发人员使用。

继两周前首席执行官Sam Altman预告,OpenAI上周宣布具推理能力的小型AI模型OpenAI o3-mini,已部署到ChatGPT及API供付费方案用户及开发人员使用。

OpenAI是于去年12月新消息12连发中,公布最新一代具推理能力的旗舰模型o3,并预告o3-mini将是最先推出的同系列模型。

OpenAI指出,o3-mini保有OpenAI o1-mini的低成本及低延迟性,但进一步拓展小模型的性能及速度,具备优异的STEM(科学、数学和程序撰写)能力。o1仍是OpenAI最主要的通用知识推理模型,但是在需要精准和速度的STEM领域o3-mini提供另类选择。在ChatGPT中,o3-mini使用中等推理能力,兼顾速度和答案的精准性。

对开发人员而言,o3 mini也是OpenAI第一个提供高呼声开发功能的小型模型,像是函数调用、结构式输入及开发人员消息等。和o1-mini相同,o3-mini也支持流媒体。开发人员有低、中、高三种推理能力,可以选择用于不同使用场景。这种弹性让o3-mini可以在解决复杂任务时更积极思考,或是在考量延迟性时优化速度。

根据OpenAI提供的数据,在AIME 2024数学基准测试中,o3-mini-high推理能力等级模型得分在87.3,优于o1-preview的56.7及o1-mini的63.6。科学解题的GPQA Diamond测试中,o3-mini-high(79.7)也高于o1-preview(78.3)及o1-mini(60.0)。程序竞赛测试(Codeforces)及软件工程(SWE-bench Verified)测试中,o3-mini-high也都高过另二个前代模型。

图片来源/OpenAI

o3-mini现在也能集成搜索功能,可提供即时网页答案及连接。OpenAI说致力于将搜索集成至所有推理模型,o3-mini是早期原型。

不过目前o3并不支持视觉功能,需要的用户还是得继续使用o1-mini。

o3-mini现在已部署到ChatGPT及API。API部分,即日起o3-mini已经部署到API使用层级3到5特定开发人员的Chat Completions API、Assistants API及Batch API。

在ChatGPT部分,Plus、Team和Pro用户现在就可以访问o3-mini,企业方案用户2月可以开始使用。在模型选择器中的o1-mini将由o3-mini取代,提供更高速限和更低延迟性。Plus和Team用户每天互动消息,由o1-mini的50则提高为o3-mini的150则。所有付费用户都可以在模型选择器,选择回应时间耗时较久的o3-mini-high,Pro用户则可以无上限选择o3-mini及o3-mini-high。

免费方案用户也可以试用o3-mini,方法是选择消息输入围的“Reason”图标。o3也是第一个提供给免费ChatGPT用户的推理模型。

OpenAI指出,由于持续提升模型数理推理能力,和GPT-4相比,现在OpenAI的模型每字词使用价格已降低95%,未来该公司会持续朝此发展。

OpenAI此举显然部分是回应横空出世的中国新兴开源模型DeepSeek。DeepSeek V3模型多项性能测试超越Meta Llama,令美国AI科技公司绷紧神经,加快研发及推出作业。

来源:十轮网

相关推荐