摘要:8月8日凌晨,万众期待中,OpenAI最新一代基座模型GPT-5终于面世。CEO Sam Altman将其描为“我们迄今为止最聪明的模型”,称第一次感觉可以将模型当成博士水平的专家来对话。而在此之前,这位“营销大师”也多次放话称,GPT-5的表现远超预期、和它
蓝鲸新闻8月8日讯(记者 朱俊熹)8月8日凌晨,万众期待中,OpenAI最新一代基座模型GPT-5终于面世。CEO Sam Altman将其描为“我们迄今为止最聪明的模型”,称第一次感觉可以将模型当成博士水平的专家来对话。而在此之前,这位“营销大师”也多次放话称,GPT-5的表现远超预期、和它相比自己一无是处,将公众的期待值推至顶点。
正如Sam Altman此前所预告的,GPT-5以统一系统的形式对外呈现。其由三个部分构成:一个智能高效的主模型,能够回答大多数问题;一个用于解决更复杂问题的深度推理模型GPT‑5 Thinking;以及一个实时路由器,能够根据对话类型、问题复杂度、用户的明确意图等,来快速决定使用哪个模型。
自2023年推出前代基座模型GPT-4后,有关GPT-5的猜测不断,却一直未见踪影。直到今年2月,OpenAI才终于推出了GPT-4.5。而在此期间,更大的光环被转移到推理模型上。OpenAI以o1、o3、o4-mini等推理模型,开启了大模型能力扩展的新范式。
一些测试过GPT-5的人员认为,该模型的能力提升程度不如从GPT-3到GPT-4时的大幅跃升。这恰体现了大模型近一年以来面临的“Scaling Law”瓶颈,即使不断增加模型参数规模、训练数据量和计算资源,带来的性能提升却开始出现“收益递减”。部分原因在于优质互联网数据的日益稀缺。
据OpenAI介绍,GPT-5在各方面都变得更加智能。在数学、真实世界编码、多模态理解和健康等评测榜单上,GPT-5的得分都要高于OpenAI的其他模型。在一项研究生级别的科学推理测试集GPQA Diamond上,GPT-5 pro的最高得分达89.4%,超过了Anthropic的Claude Opus 4.1和xAI的Grok 4 Heavy。与以往的模型相比,GPT-5出现幻觉的可能性也显著降低。
OpenAI尤为强调GPT-5在编程领域的能力飞跃,称是其“最强大的编码模型”,在复杂的前端生成和大型代码库调试方面表现出色。Sam Altman也表示,GPT-5可以即时为用户编写高质量的软件,“按需生成软件”的概念将会成为GPT-5时代的标志性特征。OpenAI还请来AI编程明星产品Cursor、Lovable为GPT-5站台,Lovable联合创始人赞其在快速构建复杂应用方面要优于其他模型。
本周早些时候,Anthropic推出升级版模型Claude Opus 4.1,同样强调在编码性能上的提升。其发布时间也正好卡在OpenAI官宣开源模型gpt-oss之前。
OpenAI曾透露,其经常性收入主要来自C端用户对ChatGPT的付费订阅、商业产品以及API销售。而Anthropic的重要收入来源则是向Cursor等编程公司客户出售其模型的使用权。根据Anthropic投资者Menlo Ventures的报告,在价值19亿美元的代码生成市场中,Anthropic占据了42%的份额,几乎是OpenAI份额的两倍。
不仅在编程这一细分赛道,GPT-4发布后的两年多以来,OpenAI面临的大模型竞争也在持续加剧,受到中美多家选手的追击。年初DeepSeek开源模型引发全球关注后,Sam Altman罕见承认在开源上“一直站在历史的错误一边”。OpenAI也在8月6日发布两款开放权重模型,是2019年GPT-2发布后的首次开放。面对Meta和扎克伯格的重金“挖墙脚”,OpenAI正初步讨论一项计划,将允许员工以5000亿美元估值出售所持公司股票进行套现。
但OpenAI依然是不可小觑的行业领军者。据其最新披露,ChatGPT的每周活跃用户数即将达到7亿,相当于全球人口的近8.6%,同比增长了4倍。其付费商业用户也达到500万,高于6月时的300万。就像Sam Altman所说,世界上大多数人可能至今只用过像GPT-4o这样的模型。
而最新发布的GPT-5模型现已面向ChatGPT免费及Plus、Pro、Team等付费用户推出,Enterprise和Edu版用户将在一周内获得访问权限。OpenAI介绍称,GPT-5对免费和付费用户之间的区别在于使用量。一旦免费用户达到其使用限制,将转换至更小、更快的GPT-5 mini模型。
来源:蓝鲸财经一点号