谷歌王者归来:Gemini 2.5 Pro屠榜AI编程界!三冠王碾压Claude 3.7,网友直呼:Cursor白买了!

360影视 欧美动漫 2025-05-14 00:59 7

摘要:谷歌Gemini 2.5 Pro震撼登场,凭借卓越的编码与多模态能力,一举斩获三冠王宝座,全面超越Claude 3.7,引领AI编程新纪元,开发者盛宴由此开启!

谷歌Gemini 2.5 Pro震撼登场,凭借卓越的编码与多模态能力,一举斩获三冠王宝座,全面超越Claude 3.7,引领AI编程新纪元,开发者盛宴由此开启!

最近真的不太平!AI界又是一声惊雷!谷歌Gemini 2.5 Pro Preview的I/O版,本是想藏着掖着等几周后的Google I/O大会的,结果大家对Gemini 2.5 Pro编码和多模态推理功能的热情太高涨,干脆提前放!让开发者们爽个够!

太长不看版,直接划重点:深夜突袭! 谷歌Gemini 2.5 Pro Preview的I/O版提前重磅更新,号称“史上最强编码模型”!三冠王登顶! 横扫LMArena所有文本、视觉及WebDev Arena排行榜,干翻Claude 3.7 Sonnet,成为首个实现此壮举的单一模型!编码能力爆表! 一张手绘草图、一句提示词就能搞定完整可交互的Web应用、游戏、模拟程序!视频也能直接转代码生成学习应用!网友炸锅! “Cursor白买了!”、“这不就是Gemini 3吗?!”、“休闲游戏行业要完蛋了!”。谷歌自家大佬也纷纷站台!

文末附新功能组合使用场景表格一览。

代码能力屠榜!直接干碎所有对手!

这货一出来,直接在LMArena所有排行榜上干翻了Claude,登顶第一!文本、视觉、还有那个卷得不行的WebDev Arena,全给拿下了!这是有史以来单一模型首次达成如此成就,简直是SOTA中的SOTA!

特别是在前端Web开发这块,Gemini 2.5 Pro Preview (I/O版) 在WebDev Arena排行榜上直接飙到第一,得分1499.95,把Claude 3.7 Sonnet(1377.10分)远远甩在身后。跟自家之前的版本比,更是暴涨了147分(旧版1278.96分)!DeepMind CEO德米斯·哈萨比斯都轻描淡写地表示:no big deal。(doge)

这下可好,网友们纷纷表示,Cursor可以卸载了,钱白交了!

(不用担心,玩笑话罢了,AI编程虽然底层是大模型,但「稳定写代码」更重要的是工程能力,目前这块Cursor依然是王者。)

一句话、一张图,应用秒生成!

这次更新的核心亮点,就是那逆天的“一提示生成应用”能力!你敢信?只需一张手绘草图,或者一句简单的提示词,Gemini 2.5 Pro就能给你构建一个功能完备、可交互的网页应用、游戏,甚至是复杂的对象模拟程序!

比如,你随手画个画板应用的草图,它就能生成一个带UI的绘画小程序。

AI艺术工具EverArt的CEO彼得罗·斯基拉诺就用它整了个“1只大猩猩大战100人”的梗游戏,Hyperbolic的CTO Yuchen Jin更是直接放话:“Gemini 2.5 Pro Preview (05-06) 现已成为我的首选编程模型…谷歌,这完全够格称为Gemini 3了!” 还有网友用不到一分钟就生成了带真实音效的俄罗斯方块风格游戏,直呼“休闲游戏行业要完蛋了!”

除了这种从零开始的骚操作,它在改进前端和UI开发、代码转换编辑、创建复杂代理工作流等方面也是一把好手。比如,给现有项目加个Win95风格的视频播放器,风格复刻得妥妥的。

多模态再进化!视频理解、代码维护也起飞!

Gemini 2.5 Pro (I/O版) 的多模态能力依然强势,视频理解能力在VideoMME基准测试中拿下了84.8%的高分!这意味着它可以直接从单个YouTube视频创建交互式学习应用,UI也比旧版更完善。

谷歌DeepMind的研究员们也纷纷晒出用“氛围编程”(Vibe Code)搞出来的各种Demo,像是芝加哥艺术学院收藏品的3D导览、智能花园规划器、听音画猜游戏、图书推荐应用等等,简直玩疯了!

针对企业级开发,它的代码维护能力也得到了强化。跨框架迁移(比如React转Vue,Angular转Next.js)错误率极低,还能有效规避“AI幻觉”导致的API调用错误(错误率降低40%),并能自动生成符合JSDoc规范的注释,技术审查效率直接起飞!Cursor的CEO Michael Truell都说新模型在调用工具时的失败率显著降低了!

开发者怎么用?价格香不香?

这么牛的模型,开发者们已经可以通过Google AI Studio和Vertex AI在Gemini API中开始使用了。Gemini App的用户也能体验到它的强大。

价格方面,谷歌表示:加量不加价!目前使用Gemini 2.5 Pro的用户将自动切换至新模型,价格仍为每百万输入token收费1.25美元,每百万输出token收费10美元,上下文窗口最多支持20万token。对比Claude 3.7 Sonnet的15美元,这价格,真香!

AI大佬Andrew Curran对此评价道:“Gemini取代Gemini是一个信号,表明有些事情已经发生了变化。谷歌在各个方面都在稳步发展。头把交椅仍会易主,但巨龙已经苏醒了。”

来源:人人都是产品经理

相关推荐