大模型“历史的终结”,就剩下谷歌与OpenAI

360影视 国产动漫 2025-04-19 18:31 2

摘要:大模型最前沿的对决,将发生在谷歌与OpenAI之间。OpenAI在大模型性能稍稍领先,谷歌在基础设施与应用生态优势明显,双方都在加速夺取对方阵地控制权。在巨头这里,AGI的探索人类智能边界的意义已经褪色,它自己的问题还远未解决,却声称要准备解决人类的许多问题。

当奥特曼让OpenAI宁可选择日活十亿的应用,而不是顶尖的大模型时,是不是大模型的历史已经终结了?

大模型最前沿的对决,将发生在谷歌与OpenAI之间。OpenAI在大模型性能稍稍领先,谷歌在基础设施与应用生态优势明显,双方都在加速夺取对方阵地控制权。在巨头这里,AGI的探索人类智能边界的意义已经褪色,它自己的问题还远未解决,却声称要准备解决人类的许多问题。

短兵相接的节奏,已经要以天来计。差不多一周时间,谷歌推出了下一代TPU与智能体协议A2A,迭代了一大串多模态模型,又推出了更省算力的思考模型Gemini 2.5 Flash;OpenAI让ChatGPT记住用户告诉过它的一切,发布了号称要淘汰GPT-4.5的GPT-4.1系列,以及会用图像思考的满血版o3与o4-mini。好几次都脸贴脸发布,火药味浓厚。

如今,在Scale AI打造的“人类最后的考试”(Humanity's Last Exam)中,排在最前列的,只有谷歌与OpenAI的前沿模型,包括这周的o4-mini与Gemini-2.5-Flash。其他能进入前十的,只有Anthropic的Cloude-3.7-Sonnet,以及DeepSeek的R1(仅限文本类排名)。

如此快节奏的发布,以及逐步趋同的功能,预示着在扩展定律边际效应减弱后,这个行业的技术路线开始收敛。这个时候,比拼的就是执行力了。员工主观意愿虽然重要,但是客观的基础设施与应用生态,在很大程度上又可以“缩放”主观意愿的效果。

下一代大模型的预训练,越来越依赖于团队对基础设施的熟悉程度与优化能力。近日,OpenAI公开讨论了GPT-4.5的训练经验,以及据此对训练下一代模型的展望。大模型参数规模越大,预训练数据集越大,硬件故障导致的损失也就越大;而基础设施的规模增长,也在放大硬件故障的复杂度,计算、存储、通信、能源,需要系统性考虑;当算力需求超出单集群的供给能力时,就不得不转向多集群训练架构,这又是全新的挑战。这些,Meta也深有体会。

因此,即使拥有无限的GPU、网络和电力,也“无法在GPT-4的技术栈上训练GPT-4.5”。不从基础设施的起点解决这个问题,GPT-5.5或许就是OpenAI上限。

行业正在进入推理时代。在大模型商品化趋势明显的当下,性价比是扩大用户规模的关键之一。对于AI应用来说,用更低的成本提供相近的服务,也是增厚利润率的来源之一。这就意味着,谁能尽可能地压榨基础设施的单位成本的算力,谁的优势就更明显。

目前看来,优势也在谷歌这一边。尽管在解决编码问题时,o3以微弱的优势领先于Gemini 2.5 Pro,但代价是需要用户付出近20倍的成本。反观主打小巧高效的o4-mini,与Gemini相比,结果不仅更贵,水平也略低一点。o4-mini所谓的高性价比,是相对OpenAI自身的产品体系而言的,不是相对整个市场而言的,这无疑削弱了它的竞争力。

目前无法完全将其归因于谷歌的硬件优势。在算法与产品层面,整个行业也还有不小降本空间。谷歌今天发布的Gemini-2.5-Flash就是如此,开发者可以通过设置预算上下限,来控制模型在思考阶段的推理深度;模型也会根据提示的复杂度,自动判断所需推理量和思考时间。

但最终竞争还是会落到芯片与基础设施上。半导体分析机构Semianalysis认为谷歌的定制TPU,总拥有成本要低于英伟达的通用GPU。“剖析数据中心,就像是窥探AGI的核心……在AI的军备竞赛中,不同公司(数据中心的)架构差异非常大。”今年2月,该机构的Dylan Patel在X上写道。当时,谷歌尚未发布专为推理而设计的AI芯片Ironwood,它的能效是上一代的TPU的2倍,Pathways技术可以助其实现高效分布式计算。

OpenAI仍是追赶者,采购英伟达的GPU,租用微软、甲骨文等的基础设施,无法最大程度地获益于芯片与基础设施优化。去年,它挖来了谷歌TPU前工程高级总监Richard Ho,但是即使一切顺利,它与博通合作的定制芯片,也要等到2026年才能启动规模量产;而且,初代自研芯片达不到成熟水平,无法迅速规模部署,至少经历三次迭代。亚马逊的Trainium已经迭代到第二代,号称可以做到40 万卡集群,但实际总拥有成本仍然远不及英伟达。OpenAI星门计划投入5000亿美元,目前采购的仍是英伟达的Blackwell架构芯片。

时间站在谷歌这一边。在追赶基础设施的两三年时间里,OpenAI的对策是培育更为庞大的应用生态。这不仅关系到规模化变现,让自己活着见到那一天,还因为这是提升用户粘性的有效手段。只有这样,才能将用户关于“性价比”的比较,锁定在自己的产品体系内。无论是丰富软硬件生态中的苹果用户,还是社交媒体网络效应下的Meta用户,不会轻易因为价格就离开这个生态。

从去年开始,OpenAI明显走向了SaaS化,为的正是孵化或并购出“一整套围绕AI打造的生态”,包括新的搜索框与硬件设备。

OpenAI加入了搜索的诸神之战。搜索是生成式AI最有希望的爆款应用之一,也是奥特曼产品矩阵理念中关键拼图。去年初,市场就流传着出OpenAI要做搜索的消息,媒体还打探到OpenAI正在积极地挖谷歌的员工;7月,SearchGPT正式内测;年底,ChatGPT上线搜索,奥特曼称这是他自ChatGPT发布两年以来最喜欢的功能,让他的使用频次翻了番。今年,OpenAI进一步将搜索与智能体组合起来,包装成最高月薪2万美元的博士级的研究助手。

近日,OpenAI还被传出正在开发一个类似X的社交网络项目。在更早一点时间,奥特曼看到Meta计划为其AI助手添加社交动态时表示,“也许我们会做一个社交应用”;他还在与马斯克斗嘴的时候反击,愿意“用97.4亿美元买下Twitter”。这都让传言变得更具体生动。

智能体是大模型应用落地的确定性路径。尽管接受了MCP协议, OpenAI仍然在构筑自己的智能体生态。o3与o4-mini拥有智能体级别的工具使用能力(agentic tool use),相较以往大模型往往是被动执行指令,它们能够思考何时以及如何使用工具。直播中,OpenAI总裁布洛克曼(Greg Brockman)还提到,o3在解决一个复杂任务时,曾被观察到连续调用了高达600次工具。1个月前OpenAI还发布了Responses API,将OpenAI模型和内置工具的互动变得更为轻松。

日前,奥特曼在接受Stratechery专访时声称,“一款10亿日活的产品,比最顶尖的AI模型更有价值”。OpenAI正在接近这个目标。去年底,OpenAI周活用户达到3亿,今年2月突破4亿;在刚过去的TED 2025大会上,奥特曼称全球10%人口频繁使用ChatGPT,短短几周内就实现翻倍。

但这一切,仍然都没有逃出谷歌的势力范围。在今年2月的财报会议上,谷歌称Gemini已经接入旗下七个拥有超过20亿用户的产品和平台。在其他产品逐步将搜索作为AI对话框的其中一项功能后,谷歌一方面继续用AI增强搜索,AI 概览覆盖了10亿月活用户,超过2亿部安卓手机可以使用“画圈即搜索”的AI功能;另一方面,去年底率先推出Deep Research功能,让它几乎成为行业标配。谷歌的A2A协议也号称比MCP更懂如何让智能体与智能体互动。

在技术仍然发散式创新的阶段,谷歌曾短暂地迷失过方向,仓促起舞,几场灾难性的发布会,成为了笑料。但在技术逐步收敛的阶段,估值3000亿美元的OpenAI,想要对决市值1.8万亿的谷歌,每一天都是挑战。

来源:人工智能学家

相关推荐