摘要:AI圈最热的风头莫过于GPT-4o的原生图像,但别急着下定论。Gemini 2.5 Pro正在悄悄反击,在Chatbot竞技场夺冠、IQ测试拿下第一后,它还能解魔方、建模型、创游戏,甚至一键生成3D打印文件!AI的下一个战场,正在从文字转向视觉与空间,谁能笑到
编辑:犀牛
【新智元导读】AI圈最热的风头莫过于GPT-4o的原生图像,但别急着下定论。Gemini 2.5 Pro正在悄悄反击,在Chatbot竞技场夺冠、IQ测试拿下第一后,它还能解魔方、建模型、创游戏,甚至一键生成3D打印文件!AI的下一个战场,正在从文字转向视觉与空间,谁能笑到最后?
要说这几天AI圈最火的模型,那肯定非GPT-4o莫属。
为了应对DeepSeek V3的一次「小升级」以及谷歌Gemini 2.5 Pro的推出,奥特曼带队上线了GPT-4o的原生图像生成功能。
随之而来的是一股吉卜力风席卷全网,火速出圈儿。
只留下谷歌在这股风中凌乱。。。
谷歌的这个旗舰模型真的这么不堪一击吗?
好像不是那么回事。
刚刚发布几天,Gemini 2.5 Pro已经冲上了Chatbot竞技场榜首的位置,超越了最新更新的ChatGPT-4o-latest以及Grok-3。
更离谱的是,在一项智商测试中,Gemini 2.5 Pro的IQ竟然高达130,离线得分也有118分。
均在所有模型中排名第一。
要知道人类平均智商为100。
虽然不太全面,但至少在有些方面,AI的确已经比大多数人聪明了!
地址:https://www.trackingai.org/home
这么厉害的模型都能干点啥,我们先来看看网友的脑洞。
从3D建模蛋糕到秒解魔方
「Gemini 2.5 Pro 是一个强大的编码模型。我能够使用它将一张图片转换成3D打印对象,并使其活起来!」他表示。
他首先用Gemini 2.0 Flash Image将妻子画的三层蛋糕转换成3D渲染图。
Gemini 2.0 Flash做得很好,添加了很多细节。
接着,他就让新发布的Gemini 2.5 Pro模型编写OpenSCAD代码来复制这个3D模型。
这个过程中还需要同时注意可打印性。
最后,点击打印按钮,就得到了一个可爱的玩具!
Fei表示他非常喜欢所有的细节。
左右滑动查看
X上的大V Shruti Mishra贴出了一些实测Gemini 2.5 Pro的震撼用例。
比如,使用Three.js创建一个3D汽车模拟器。
接下来是个老节目,旋转多边形和弹跳小球的动画。
实测中两个模型使用了相同的提示词。
不得不说,Gemini 2.5 Pro与GPT o1 Pro表现得都很棒,o1 Pro的小球还有一些动效。
Gemini 2.5 Pro生成的小球可能更接近真实情况一些。
甚至创建出一个Minecraft游戏。生成一个3D魔方,然后解开它。
你还可以调整魔方的阶数。
轻松制作一个高尔顿板模拟器,更直观地理解概率、统计、正态分布、大数法则、二项分布等抽象数学概念。
还有经典的3D飞行游戏。
不过这游戏场景看起来还不够丰富。
Advanced用户可以使用Canvas
刚刚,谷歌官方宣布,Gemini Advanced用户可以在Gemini 2.5 Pro中使用Canvas进行创作了。
他们还给出了一个3D恐龙世界示例,表示仅用几分钟和几个提示就完成了。
谷歌表示他们正在努力让Gemini 2.5 Pro尽快对更多人开放试用。
在GPT-4o的声势和吉卜力画风席卷全网之际,谷歌的Gemini 2.5 Pro悄然崛起,用一连串硬核的技术实力和实战应用回应了所有质疑。
从3D建模到秒解魔方,从高尔顿板到Minecraft游戏,无论你是开发者、创作者,还是科技爱好者,现在是时候重新认识Gemini了。
别只盯着热度,真正的力量,往往藏在冷静的数据和落地的能力中。
参考资料:
来源:新智元一点号