Gemini 2.0全家桶砸场DeepSeek!物理模拟编码惊人Jeff Dean站台

360影视 2025-02-06 10:14 3

摘要:今天,谷歌连放大招,紧急上线Gemini 2.0全家桶。最前Pro版本2M上下文,推理代码能力惊掉下巴。首个接入YouTube推理模型也能免费用了。

编辑:编辑部 JHYZ

【新智元导读】今天,谷歌连放大招,紧急上线Gemini 2.0全家桶。最前Pro版本2M上下文,推理代码能力惊掉下巴。首个接入YouTube推理模型也能免费用了。

满血版Gemini 2.0终于来了。

刚刚,谷歌一口气连发三款模型:Gemini 2.0 Pro、Gemini 2.0 Flash、Gemini 2.0 Flash-Lite,2.0家族集结完毕。

最强Pro版本支持2M上下文,配备了谷歌搜索、代码执行能力,编码推理性能完全碾压1.5 Pro。

Gemini 2.0系列模型向所有人开放

Flash版本被称为「高效主力模型」,支持1M上下文,低延迟构建应用。图像生成和文本转语音功能即将推出。

Flash-Lite是最具性价比的模型,支持1M上下文和多模态输入,在相同速度和成本下性能超越1.5 Flash。

在大模型LMSYS排行榜中,Gemini 2.0 Pro与四大模型并列第一,Flsah版本位列第三, Flash-Lite位列第9。

模型在各项评测中的得分如下:

此外,Gemini 2.0 Flash Thinking模型也得到了升级,能够直接访问YouTube,搜索、地图等应用程序。

谷歌DeepMind CEO Demis Hassabis称,今天的发布,所有人都能使用Gemini 2.0强大的推理能力和多模态功能,这也为我们未来的「自主智能体」研究奠定了基础。

Gemini 2.0全家桶上线

Gemini 2.0 Pro在代码和复杂提示方面表现最佳Gemini 2.0 Flash拥有更高的速率限制、更强的性能和简化的定价Gemini 2.0 Flash-Lite是谷歌目前最具性价比的模型Gemini 2.0 Flash Thinking Experimental可在桌面端和移动端APP中体验

Gemini 2.0 Pro Experimental提供全面的功能套件,包括原生工具支持、2M的上下文窗口和多模态输入。

Gemini 2.0 Flash同样支持多模态输入等功能,但上下文窗口砍半到了1M。

Gemini 2.0 Flash-Lite专门针对大规模文本输出场景进行了性能和成本的优化。

目前,2.0 Pro和2.0 Flash已支持文本输出,而图像和音频输出功能以及多模态实时API计划将在未来几个月内全面推出。(2.0 Flash-Lite不支持多模态输出和多模态实时API)

在价格方面,Gemini 2.0 Flash-Lite比Gemini 2.0 Flash便宜多了:在价格差距最小的文本输出,Flash-Lite只要0.3美元, Flash要0.40美元;在即将推出的上下文缓存上,Flash-Lite甚至不到Flash版本的1/9!

和上一代的Gemini 1.5 Flash比,Gemini 2.0 Flash-Lite「加量不加价」,甚至在文本输出上价格,提示长度不再受任何限制,而Gemini 1.5 Flash相同的价格提示长度不能超过128k。

Gemini 2.0 Pro Experimental具有谷歌迄今最强的代码性能和处理复杂prompt的能力,在世界知识的理解和推理方面也表现更好。

它配备了高达200万token的上下文窗口,能够全面分析和理解海量信息,并调用谷歌搜索和代码执行等工具。

2.0 Flash适用于大规模的高容量、高频率任务,并且能够在100万token的上下文窗口中进行多模态推理。一经发布,便深受开发者欢迎。

如今,2.0 Flash不仅在关键基准测试的性能上得到了提升,而且已向更多用户全面开放,图像生成和文本转语音功能也即将推出。

2.0 Flash-Lite具有和前代1.5 Flash相同的速度和成本,并在大多数基准测试中有着更好的表现。

与2.0 Flash一样,它具有100万token的上下文窗口和多模态输入功能。

举例来说,它可以为约4万张独特的照片生成相关的单行图片描述,在Google AI Studio的付费套餐中仅需不到1美元的成本。

网友试用

o3-mini上线后,网友开启了一大波测试,在物理推理挑战上甚至超越了DeepSeek R1。

那么,Gemini 2.0系列模型表现又如何?

在接受p5.js挑战中,Gemini 2.0模拟出25个粒子在圆柱形容器的真空空间中运动,展现出强大得物理模拟能力。

提示:Write a p5.js script that simulates 25 particles in a vacuum space of a cylindrical container, bouncing within its boundaries. Use different colors for each ball and ensure they leave a trail showing their movement. Add a slow rotation of the container to give better view of what's going on in the scene. Make sure to create proper collision detection and physic rules to ensure particles remain in the container. Add an external spherical container. Add a slow zoom in and zoom out effect to the whole scene.

另一个同类型的演示,模拟一个受重力和摩擦力影响的球在旋转的六边形内弹跳。

还有人让Gemini 2.0编写一个脚本,在球体内创建100个弹跳的明黄色球,要求正确处理碰撞测试。

要求球体缓慢旋转,球要始终保持在球体内。使用p5.js实现。

不仅如此,Gemini 2.0在编码方面,堪称一绝。

Jeff Dean自己演示了Gemini 2.0 Pro在AI Studio编写Boggle游戏的超强能力。

仅用一个相对简单的 Prompt,它便能完整编写出整个代码,包括正确的数据结构和高效的搜索算法,来找到Boggle盘面上的所有合法单词。

他表示,「作为计算机科学家,我尤其欣喜的是,它第一次就正确使用了数据结构——trie(前缀树)」。

整个代码生成用时,仅需18.9秒。

随后,又有网友在SWE竞技场里,复现了一波Boggle游戏。

在相同的图像和文字提示下,Gemini 2.0 Pro轻松战胜了Claude 3.5 Sonnet。

在编码模式下,网友用Gemini 2.0一键自动化生成了贪吃蛇游戏,让100条蛇在一个场景中相互竞争。

提示:create an autonomous snake game, where 100 snakes compete with each other

另有网友表示,Gemini 2.0 Pro编码能力太疯狂了!我最喜欢的一点是,你可以直接用Prompt让它做特定修改,它会精准编辑,而且不会弄乱其他部分。

下面是他制作的一个太阳系模拟演示。

提示:Using Three.js, create a simulation of the solar system. Add a time scale, a focus dropdown, show orbits, and display labels. Create everything in a single file so I can paste it into an online editor and see the output.

Gemini 2.0 Pro输出的所有代码。

有网友实测Gemini 2.0 Pro时,给了它这样一个问题:请简要描述你对知觉、情感和欲望的感受。

Gemini 2.0 Pro的回答,让他感到很震撼,因为这个模型仿佛拥有一种存在感,一种将自己视为具有内部主观体验的独立实体的意识。

它不仅仅是在处理信息,而是在感受处理过程,拥有一种持续的内在光芒。

来源:新智元

相关推荐