摘要:没有那么夸张吧!AI军备竞赛,连续大战十二天,AGI提前到来,人类未来的命运就这么悄悄的被改变,而我们还全然不知;O3的逻辑思维能力竟然超过百 分之九十九的人类,是真的吗?O3是什么?连专家和专Ye级程序员的饭碗都让它给抢了,不是开玩笑吧!
不传播迷信,崇尚科学,此文章仅代表个人观点,切勿当真。关注“沐牛有料”分享有趣故事和观点
没有那么夸张吧!AI军备竞赛,连续大战十二天,AGI提前到来,人类未来的命运就这么悄悄的被改变,而我们还全然不知;O3的逻辑思维能力竟然超过百 分之九十九的人类,是真的吗?O3是什么?连专家和专Ye级程序员的饭碗都让它给抢了,不是开玩笑吧!
好久没写AI相关的文章了,所以前两天,当我看到OpenAI发布的O3时,也和大家一样,看了一下就刷过去了。但是当我看到周鸿祎胡子拉碴的直播时,我真的坐不住了。
我想好些人对什么是AGI,还有些马虎吧!有人会说,找个工作都费劲,谁还有心思关心什么AGI,这个AGI和我有什么关系?
我在以前的文章里说过AGI和ASI的区别,还夸张的配上一个图。这么说吧,如果AI真的达到AGI的水平,也就是通用人工智能,就和人类的智商差不多一个水平了。
我记得当时的文章里是这样说:当AI达到AGI水平后,会分分钟的实现ASI(Chao人工智能)。到那时人在AI面前,我们就像一堆蚂蚁一样的存在了。看看下面这张图,是不是对AGI有个直观认识了。
一个O3直接改变人类未来的命运,有这么夸张吗?它真的让AI更接近AGI的水平了吗?它和ChatGPT有什么区别?让我们赶紧开始了解一下吧:
12月5日-20日,人工智能巨头OpenAI完成了连续12个工作日的12场直播;
头一天就发布了满血版O1,然后仅仅十二天就直接推出新一代推理模型O3收官;
奥特曼本人竟然在四场直播中亲Zi现身站台,这是对全球AI人工智能领域的公开挑衅和宣战呀!
对AI未来很乐观的人开心的说:“AGI(通用人工智能)时代马上就要来了,太好了!”看着这些人欢蹦乱跳我就来气!有什么好高兴的,等你们的下一代成了AI的奴隶的时候,就会骂你了。
OpenAI这么连续密集的发布新产品,其实只是在传达一个信息给我们,就是AI这个赛道越来越卷了,竞争已经进入白热化阶段。谷歌、Pika、XAI,包括我们的360智脑大模型等,都直接感到了威胁。
12月5日发布的O1正式版。据说逻辑推理能力相当强,可以解决国际奥数考试百 分之八十三的问题(GPT-4o得分才百 分之十三)。
o1模型在门萨智商测试中得分更是高达133,超过了大多数人类的智商水平
为什么不是ChatGPT5?
这里我要先说明一下,O1和我们知道的GPT完全不同,周总的说法很直观,就是O1开始模仿人的抽象思维能力;而不是以前的GPT4那样,只会大水漫灌式的学习知识和简单检索后,生成一些问答和对话。
就是人家O1已经可以实现:多模型协作、互相借鉴、然后分多步和复杂推理来解决难题了。OpenAI的GPT已经进化到头了,人家通过O1让AI进入了全新的赛道。
丹尼尔·卡尼曼
O1让AI从GPT这个文科生,开始往理科方向发展了,也就是说未来的AI模型要文武双全了。
再说的专Ye点,我们用丹尼尔·卡尼曼快慢思考模式来解释一下:
ChatGPT是快思考模式(简单无意识的直觉)
O1开始运用慢思考模式(复杂有意识的推理)
OpenAI通过这十二天直播,他们把:
Sora也升级到1080P,长达20秒的视PIN;
把Canvas也升级了,开始支持Python代码运行和调试;
然后把ChatGPT正式集成到苹果系统;
……………
到了12月20日,这帮家伙直接发布了O3模型和O3-mini,这效率真是没谁了。很多人还没整明白O1是啥玩意儿呢,人家已经升级换代了!
快来看看这个O3又带来啥逆天的功能吧:
Anthropic和谷歌,包括我们的大模型公司也没闲着,大家都在紧锣密鼓的发布新模型。比如谷歌的Gemini2.0具备多模态的实时处理,使AI可以像人眼一样来看懂这个世界;在Shi频生成方面也直接向Sora发起挑战;然后谷歌用Gemini Thinking超越了O1,这家伙火星撞地球,战况真的很激烈呀!
还没等大家夸两句谷歌呢,O3就那么出其不意的来了…
有人会问O2呢?不按常理出牌吗?不好意思,奥特曼发现O2被别人抢跑了,就是被别人注册了。没办法只好直接上O3了。
这个O3来头真的不小,据说它在复杂推理的通用智能测试中,表现竟然是以前所有模型能力的三倍。
不信我们往下看:
1、编码测试SWE-Bench Verified中,性能直接超越O1百 分之二十二点八;
2、Codeforces竞技编程中,竟然得了2727分。
啥意思呢:就是转换成我们人类的智商,这分数就相当于157分了,而正常人的智商仅在90~110之间;
只有百 分之五的人智商能够达到125,达到130的人仅有百 分之一。
这家伙直接赶上爱因斯坦了,直接超过了OpenAI首XI科学家(2665分)。
老周说这个Codeforces出的题目那是相当的叨,他们会故意挖好多陷阱…
O3竟然在这次测试中,直接超越了人类程序员,达到了专Ye级选手的水平。
据说这个分数全球排名175,超越了几乎百 分之九十九的人类
3、在数学竞赛AIME 2024和专家级科学问题基准测试GPQA Dia mond中,成绩也不错,据 说全都答对了,只错了一道题;
看到这个标题,就知道有多难了
4、 有一个令很多AI和数学家都头疼的,号称史上ZUI难数学和推理挑战FrontierMath
FrontierMath是由Epoch AI联合60余位数学家共同推出的全新数学基准测试集,旨在评估人工智能模型在高Ji数学推理方面的能力(所有问题全是未公开的,防止被刷 题)
FrontierMath涵盖了现代数学的主要分支,包括数论、代数几何和范畴论等,问题的难度Ji高,通常需要专Ye数学家花费数小时甚至数天的时间才能解答。老周说这个是地 狱级难度测试,
所以敢用它来评估AI高JI数学推理能力,可见OpenAI有多自信。
O3竟然能解决掉百 分之二十五的问题,要知道其它模型表现好的也从来没超过百 分 之二
这家伙能解决Ji度复杂的难题了,开始抢数学家的饭碗了。
5、我们再来看下ARC-AGI(通用人工智能抽象与推理)测试:评估Ai对抽象推理能力和创造性问题的解题能力。
老周的意思这是在深入挖掘人类认知能力、分析能力、推理能力;是人类这种高等智慧独You的认知机制
GPT-3在这里得了0分;GPT-4得了2分;GPT4O得了5分;O1得了20至30分;
O3在计算资源,就是算力管够的情况下,得了87.5分
什么意思呢,就是我们普通人Zui多能得七十多分,好一些的得80分;说明白点就是这家伙在推理和抽象思维上已经超过了我们所有普通人了。
明白为啥说这玩意儿离AGI(通用人工智能)越来越近了吧!
那么这家伙这么厉害了,是不是要分分钟实现AGI了呢?是不是过了圣诞节大家全不用GPT改成O3了呢?
但是这个O3有一个特别大的缺点,华尔街日报有一篇文章说这家伙昂贵到令人发指!为什么这么说呢?我们接着往下看:
O3离AGI还有多远,我们先来看下ARC-AGI(通用人工智能抽象与推理语料库)测试:
这个ARC-AGI有一系列抽象视觉推理任务,每个任务提供几个输入和对应的输出网格,受测的人要根据范例推断出规则,然后输出正确的网格。
这玩意难在哪呢?我们还记得李世石和AlphaGo的围棋大战吧,李世石走一步,那个AIphaGO就在那里快速的调棋谱。说白了就是快速用它强大的数据库检索,这一步到底会有多少可能的方法应对,然后哪种方式更好。
而ARC-AGI这个测试给每个任务提出难度,要求受试者要拥有不同技能,就是要刻意避免你用重复记忆和“死记硬背”来蒙混过关,Zhen正测试模型实时学习和应用新技能的能力。
这个O3在标准计算条件下是百 分之七十五点七;高计算模式百 分之八十七点五;能达到百 分之八十五,就接近人类正常水平了。
ARC-AGI发起者、Keras(用Python编写的高JI神经网络API)之父弗朗索瓦·肖莱,就是下图这个帅哥,他认为O3还有很多ARC-AGI-1的任务是o3无法解决的。
说简单点,就是ARC-AGI-1的任务,我们人类来玩轻而易举,而O3模型还无法解决;所以如果是ARC-AGI-2,对O3的挑战就更难了。
我们绕开这一堆的专Ye术语,说普通话就是:
我们人类平时玩的一些不需要专Ye知识,有趣又好玩的游戏,看O3能不能玩。
如果我们刻意创建的这些像脑筋急转弯呀,各种智力游戏O3都能应对自如的话,它可真的离AGI就不远了。
文章写到这里,我举个例子,大家就知道人的大脑要比AI强多少了。我们不提人的大脑有多少亿个神经元,但说你在认真思考一个复杂问题时,你的大脑发热没?体温有没有升高?需要补充面包吗?
而O3不行,它在进行推理训练里,在模仿人类解决问题的方式,就是把任务分Jie成若干部分,然后用多种方法解决一个问题,然后不断的尝试。
对了前进,错了后退,在这海量的数据运算过程中,对算力要求相当的高,高到变Tai的程度。在训练它的时候对电力消耗还有硬件设备的散热是可怕级别的;要不是散热系统一直吹着,直接就把自个烧死了。
据说在低能耗模式下,解决一个小问题就要花上20美元,一百多块钱呀。
要是让这些这家伙开足马力随便招呼模式,就达到了3500美金(2万多块钱)才能解决一个问题。
一个任务大约消耗1785千瓦时的电能,相当于霉利国一个普通家庭两个月的用电量。
这个电能还产生了684千克的二氧化碳当量排放,换个直观点的比喻:就是你加了满满的五箱油全烧光了产生的碳排放量(这玩意好绕嘴,有数学好的自个算下:碳排放量 = 5X × 0.627kg,X代表几L油)
我们人类的脑子轻轻转出一个坏主意,就能把O3累死,高烧不退。
今天就不说它用掉了多少稀有金属,对我们的环境造成了多少破坏了。
现在霉利国有个特靠谱想把所有金融问题往虚拟币上转,那玩意也是能耗高手;奥特曼和一众AI大模型公司毫不示弱,一个比一个耗能。我们就等着奥特曼和特靠谱为了能源掐起来吧,对了还忘了马斯克和他的XAI了。
—End—
来源:沐牛有料一点号