谷歌AI突然登顶，震惊全球

摘要：近日，谷歌提前放出了全新升级的Gemini 2.5 Pro Preview（I/O版），新模型一举拿下三连冠，登顶LMeana。

谷歌AI拿下三连冠

科技巨头谷歌突然开大，在AI领域掀起了滔天巨浪。

近日，谷歌提前放出了全新升级的Gemini 2.5 Pro Preview（I/O版），新模型一举拿下三连冠，登顶LMeana。

同时，它也成为首个横扫文本、视觉、WebDev Arena基准的SOTA模型。

进一步说，这也是自2022年底ChatGPT引爆生成式AI热潮以来，谷歌首次在关键的代码生成评估指标上全面领先，击败所有竞争对手。

图源：Google

此次发布的版本是今年3月发布的多模态大语言模型Gemini 2.5 Pro的重大升级版。

谷歌在表示，本来计划在谷歌I/O上发布这个更新，但看到大家对这款模型的热情高涨，所以决定提前放出，让所有人能尽早开发使用。

目前，该模型已向Google AI Studio的独立开发者、Vertex AI云平台的企业用户以及Gemini应用的普通用户开放。

同时，谷歌表示，其并未调整模型定价或速率限制：目前使用Gemini 2.5 Pro的用户将自动切换至新模型，价格仍为每百万输入token收费1.25美元，每百万输出token收费10美元，最多支持20万token的上下文窗口。

相较于Claude 3.7 Sonnet的15美元，很显然谷歌模型更具价格优势。并且，企业用户还可通过Canvas工具实现低代码开发流程。

图源：Google

公开数据表明，谷歌新模型得分为1499.95，远高于Sonnet 3.7的1377.10，编码性能碾压Claude 3.7 Sonnet。

图源：微博

此前，旧版本的Gemini 2.5 Pro（03-25）得分为1278.96，排名位列第三。当然，这也意味着新版本实现了221分的大幅跃升。

同时，DeepMind CEO德米斯·哈萨比斯也表示，“非常高兴能与大家分享我们有史以来构建的最佳编程模型！今天，我们发布了 Gemini 2.5 Pro Preview I/O 版，编程能力得到了大幅提升。此版本在 LMArena 编程类别中排名第一，在 WebDev Arena 排行榜上同样领先。”

图源：微博

可以说，头把交椅的易主，尽显谷歌的实力与野心。

新模型的三大亮点解读

当然，从谷歌公布的各项初步基准测试结果来看，外界对新模型的盛誉也并非夸大其词。那么，我们来聊一聊有哪些让人眼前一亮的提升。

首先，Gemini 2.5 Pro Preview（I/O版）重点突破在于：只需通过一条提示即可构建完整、可交互的网页应用或模拟程序。

对此，谷歌表示，用户可以输入视觉模式或主题性提示，将其直接转化为可运行的代码，这显著降低了设计导向型开发者或创新团队的入门门槛。

图源：Google

换句话说，作为普通用户，即便没有编程基础，也能通过Gemini 2.5 Pro Preview（I/O版）快速构建复杂应用。

例如，用户只需用自然语言描述需求，或上传一张手绘草图，Gemini 2.5 Pro I/O版就能自动识别草图布局并生成响应式代码，若用户绘制了一个麦克风图标，系统不仅会生成录音按钮，还会配套动态波形动画和暂停逻辑，最后自动生成功能完备的Web应用。

图源：微博

同时，用户添加新功能时，模型能继承现有项目的视觉风格，避免“拼贴感”，例如在已有React项目中新增组件时，CSS类名和动画曲线会自动对齐。

对此功能，AI艺术工具EverArt首席执行官彼得罗·斯基拉诺测试后直接表示，新版Gemini 2.5 Pro I/O能够通过一个提示就生成互动模拟游戏，完美还原了“1只大猩猩大战100人”的社交媒体梗。

图源：微博

同时，Hyperbolic联合创始人兼CTO Yuchen Jin也写道：“Gemini 2.5 Pro Preview（05-06）现已成为我的首选编程模型。在多个高难度提示词测试中，它已超越o3（GPT-4o）和Claude 3.7 Sonnet。以编写模拟水桶来回晃动的水体效果这个提示为例，其表现完全碾压另外两个模型。谷歌，这完全够格称为Gemini 3了！”