AGI“曼哈顿计划”或被采纳,科研投入超万亿美元

360影视 2025-01-18 18:36 2

摘要:2025新年开端,腾讯科技联动AI浪潮的创新者,推出“AI未来指北”趋势预测系列,透过他们的视角共同窥探AI与人类共生的未来图景,感受新范式的磅礴力量与深远影响。

【编者按】2025新年开端,腾讯科技联动AI浪潮的创新者,推出“AI未来指北”趋势预测系列,透过他们的视角共同窥探AI与人类共生的未来图景,感受新范式的磅礴力量与深远影响。

特约作者 快思慢想研究院院长 田丰

编辑 郭晓静

历史上每一次工业革命中,天才发明工具,大众使用工具,带来社会生产力全面提升,新生产供给打开了更大规模的社会商品需求。基于科学知识的大量发明,孕育了工业革命的“工具潮”,并最终带来了蒸汽机为代表的通用技术革命。人工智能既是科学革命、技术革命,更是产业革命。

在2022年ChatGPT问世以来,生成式AI工具大量扑面而来,而底层人工智能算法架构、芯片技术仍在高速发展,叠加新能源、卫星通讯、机器人、量子计算等技术群落效应,人类社会“忽如一夜春风来,千树万树梨花开”,全民的希望、焦虑、迷茫、欲望都集中在滚滚向前、势不可挡的科技变革巨轮上。

2025年开年,我们站在科技与文化的交叉路口,一起掀开未来人类文明巨变大幕的一角,探索新一波工业革命的“曙光”。我们将从AI产业增长潜力、关键技术突破、全球竞争格局等方面,观察及总结AI的发展,预测AI领域未来的关键变量,并在每个部分的结尾,推荐可供读者深入阅读和思考的书籍。

硬科技为王

全球AI产值5年4倍增长

首先,从人工智能产业的增长潜力来看,可以说人工智能的“雪道”又长又厚。按照约瑟夫·熊彼特(Joseph Schumpeter)的“长波创新周期”来分析,从1785年至今的6波科技革新浪潮,创新周期从60年持续逐步缩短到25年,最近以人工智能、物联网、机器人和无人机、清洁(能源)技术为代表的新一波科技浪潮,起步于2020年,新质生产力蓬勃发展到2045年。

全球进入新一轮硬科技创新周期,“应用为王”让位于“硬科技为王”。截止2024年12月底,商业航天SpaceX公司估值跃升至3500亿美元,超过3000亿美元估值的视频平台字节跳动,赢得全球独角兽排行榜第一,而第三名OpenAI估值达1570亿美元,也是最近两年估值飞速增长的AI独角兽。

人工智能尚处于商业爆发前期。据Statista数据分析,未来5年,人工智能对全球GDP具有重大影响,按“中等情况”分析,2025年AI直接带动全球2.92%的GDP,约3.2万亿美元,到2030年则直接带动9.54%的GDP,约12.4万亿美元,即5年AI产值增长近4倍(3.87倍)

另一个例证就是法国Aventis Advisors的《2024年人工智能估值倍数报告》显示,2015年AI投融资大爆发时,OpenAI创立,虽然最近3年全球投资频次持续下滑,但仍高于2015年水平线,2024年全球AI融资逾5000次,且60%以上处于A轮以前。

布拉德福德·德龙在讲述全球工业革命经济史著作《蹒跚前行》一书中讲到:“工业研究实验室、现代公司与全球化掀起了发现、发明、创新、应用和世界经济一体化的浪潮,极大地提高了我们的全球有用经济知识指数。”那么在可预见的未来20年中,人工智能实验室、智能协同网络、联盟生态化,将掀起另一场世界经济变革的浪潮。

人工智能的“细分赛道”

感知智能 & 多模态

在这个爆发初期的大产业中,如何找到最值得关注的细分赛道?在柏拉图《理想国》书中提出的洞穴思想实验,从前有一个洞穴,洞穴内的囚犯只能看到墙壁上洞外世界物体的影子,久而久之囚犯就把影子当成了对现实的认知,但影子并不是真实世界的准确表达。

当今“单模态”的语言类大模型正如洞穴中的囚犯,出现了幻觉、偏见等原生问题,要想从根上解题,必须让AI走出“洞穴”,像人类一样多模态地与物理世界交互、学习、纠偏,所以多模态AI将成为2025年的兵家必争之地。

AI无处不在,感知大千世界。在2024年底的OpenAI、微软的系列发布会中,我们发现AI能够系统性感知“三个世界”:

(1) 感知“物理世界”:OpenAI 4o模型通过摄像头,指导程序员做手工咖啡,体现了对物理环境、人物动作、任务阶段性结果的感知能力。

(2) 感知“数字世界”:微软Copilot办公助手能够识别、记忆、分析电脑屏幕,主动发现用户屏幕上的图表、数字、文字的问题、特征。

(3) 感知“精神世界”:OpenAI 4o模型通过手机摄像头感知用户通宵加班的精神状态,主动嘘寒问暖,给出充满温度的关心建议。

因此从GPT4之后的下一代生产力模型,是猎户座为代表的多模态模型、Operator为代表的多模态智能体,相当于给AI装上了“眼睛”和“耳朵”,甚至具身机器人为AI装上了有触觉的“手”和“脚”。

据Statista最新数据预测,在2025-2030年期间,AI机器人、自主与传感技术,将会快速发展,甚至反超机器视觉,成为新兴赛道;另一方面,机器学习、自然语言也将保持快速发展态势。

斯坦福大学李飞飞教授在《我看见的世界》一书中有两段有趣的感知智能描述:

“5.43亿年前......这种感官剥夺的影响是深远的,由于(海洋生物)什么都看不到,听不到,摸不到,早期的生命形式没有任何可思考的对象。”“在一个没有感官输入的世界里,生物没有能力收集关于世界的信息,因此大脑完全没有存在的必要“由此可见,无感知,无智能。

复杂推理

孕育“因果式AI”

未来高水平推理应用,正在推动“生成式AI”向“因果式AI”升级。图灵奖得主、美国国家科学院院士Judea Pearl旗帜鲜明地指出:“虽然概率体现了我们对静态世界的信念,但因果关系告诉我们,当世界发生变化时(无论是通过人为干预还是想象行为),概率是否会改变以及如何改变。”简而言之,相关性为主的生成式AI只能描述静态世界特征,而因果性为主的因果式AI能够认知判断世界动态发展规律。所以2024年AI科学家赢得诺贝尔物理奖、化学奖,只是一个开始,今后将会有越来越多的跨学科奖项花落AI。

GPT-4之后,全球大模型的研发形成了“分叉”的两条路径。一是像科学家一样严谨的强推理模型,o1(草莓)、o3等;二是具有多模态感知和生成能力的生产力大模型,如4o、猎户座Orion等。

圣人无常师,AI弟子未必不如人类师傅,推理领域AI正在逼近超越人类专家。以2024年底OpenAI最新发布的o3模型分析,在AIME 2024国际奥数比赛题中o3考试拿下96.7分,接近满分;在以物理、化学、生物等科学题的GPQA基准测试中,o3考出87.7分的高分,超过人类平均水平69.7分;在Codeforce编程题考试中,o3得分2727分,超过了99.99%的人类程序员,而且超过了研发o3的OpenAI首席科学家Jakub Pachocki(雅库布·帕乔基)的 2655分。在通用人工智能题库ARC-AGI基准测试中,o3最高取得了87.5考分,已经超过了人类专家的85分,并在2025-2026年向人类最高的95分攻坚。

读者朋友们,若想对逻辑推理有更深一步的理解,推荐阅读亚里士多德《工具论》:“大致来说,命题和问题分为三种。有些命题是伦理的,有些是自然哲学的,有些则是逻辑的。”当今人工智能正在通过学习人类科学家的“思维链”来实现这三类命题的复杂推理。

人工智能是重资本的

“科研军备竞赛”

重资本的长期投入是人工智能基础科研的“铺路石”。人类历史上每一次科技创新,都带动了世界范围的重资本基础设施建设,从铁路网、高速公路网、电网、互联网、AI数据中心都如此,所以拿美国举例,通过基础科研不断逼近“AGI时刻”(通用人工智能)的四骑士背后都有异常强大的金主持续投入:

(1) OpenAI的赞助方是3.4万亿美元的微软;

(2) DeepMind的收购方是2.4万亿美元的谷歌;

(3) Anthropic的投资方是2.5万亿美元的亚马逊;

(4) xAI背靠1.5万亿美元的特斯拉。

AGI竞赛,不出钱,就出局。在下一代通用人工智能的“军备竞赛”中,仅算力一项,研发投资门槛就高达5年1000亿美元。例如从Omdia分析师数据来看,2024年微软、字节跳动、腾讯、Meta、特斯拉、亚马逊几家大厂就从英伟达购买了49至20万块GPU芯片,各家的年度投资都是100亿美元起步,而在AI算力、人才上的投资半途而废就意味着退出AGI竞争。微软总裁布拉德·史密斯(Brad Smith)宣布2025年将投资800亿美元建设AI数据中心,以训练AI大模型。

“算力常胜”的初期AI盈利模式也脱颖而出。第一类赚钱的公司是AI芯片厂商,以英伟达为例,2017至2024年,数据中心业务7年实现10倍营收增长,市值9年增长215倍。第二类赚钱的公司是AI云算力商,以微软云Azure为例,从2019年到2024年,季度营收5年实现2.6倍增长,微软市值同期增长3倍。第三类赚钱的公司是已经实现规模化供给的AI服务商,以特斯拉为例,2019至2024年,特斯拉年度营收5年增长3.3倍,市值增长17倍。

穆斯塔法·苏莱曼,迈克尔·巴斯卡尔在《浪潮将至》一书中认为:“这场浪潮由两大核心技术所定义:人工智能和合成生物学。它们将共同开启人类的新黎明,创造出前所未有的繁荣和富足。”我们正在接近人类命运的关键节点,这一节点决定着人类命运的未来走向。我们已被人工智能包围,生活中的一切都将改变。或许这才是全球科技巨头们超大规模押注人工智能的根本原因。

从“数字AI”到“物理AI”

大模型科技创新的上半场是“知识工程”,下半场是“工业革命”。谷歌DeepMind、OpenAI尝试从知识密集型的“数字AI”走向AGI,而特斯拉、英伟达在努力探索制造业、交通运输业的“物理AI”。人类从婴幼儿开始,就是不断与物理世界交互学习的过程,然后进入学校学习抽象的知识传承,属于“自然选择”机制。而目前人工智能恰恰相反,先学习海量数字化知识,再以机器人身体进入物理世界“进修”,属于“人类选择”机制。这可能就是“莫拉维克悖论”的原因。(注释:“莫拉维克悖论”指要让AI如成人般地下棋是相对容易的,但是要让电脑有如一岁小孩般的感知和行动能力却是相当困难甚至是不可能的)

虽然“数字AI”和“物理AI”的AGI科研路线尚无定论,但诸多企业家、科学家们都纷纷预判通用人工智能AGI将在6年内到来。

AGI时刻预测时间点各不相同,是因为AGI的定义不同。OpenAI用5级能力体系定义AGI,L1是聊天机器人,例如ChatGPT,L2是推理者,例如o1、o3,L3是代理型智能体,例如尚未发布的Operator,L4是创新者,能给出人类没想到的科研与产业创新方案,L5是组织者,一组AI能形成有效协同的生产力组织。

谷歌DeepMind则依照弱人工智能升级路径,相应提出了6级AGI能力体系框架,即按照AI等同于专业领域的专家水平,来定义跨领域的通用人工智能,例如等同于不熟练人员学徒级、等同于50%人类技能的合格级、等同于90%技能的专家级、等同于99%技能的大师级、超过100%技能的超级人工智能(ASI)。需要说明的是AGI不止是在一个垂直领域达到分级水平,而是在跨领域实现高水平通用智能。

我更倾向于谷歌对AGI的定义,即从整体能力上来评估,AGI应具有各个领域的通用智能、同时在垂直领域具有等同于人类大师水平的专业能力。如下图所示,目前只存在单一领域超过人类大师水平的专业弱人工智能,例如AlphaZero打败了所有人类围棋选手,或者存在学徒级水平的通用知识智能,例如ChatGPT,所以AGI或将迎来新一波架构革新、理论创新。

当“AGI时刻”真正到来时,“世界模型”很有可能万象归一。不论是强推理模型路径,还是多模态模型发展路径,都将融为一体,正如人类只有一个大脑一样,一个AI模型解决所有问题。

对于通用人工智能到来时,会发生哪些产业变革、社会变革,推荐阅读《科学与忠诚:钱学森的人生答卷》一书,用战略科学家的科学思维方法解构飞速发展的人工智能科技,钱老先生通常一语胜千言——“用机器代替人的体力劳动,是第一次工业革命,即机械化;

用机械系统来替人作非创造性的脑力劳动,是第二次工业革命,即自动化。”“我们还处在第二次工业革命的前夜,明天才是超高速飞行、星际航行、无人工厂、自动化办公室和图书馆的时代。到那个时候,人们终于摆脱了一切非创造性的劳动,实现了共产主义的生产方法。”

“曼哈顿计划”与“奥本海默时刻”

人工智能属于赋能型科技,是大国竞争的国之重器,所以美国为首的国家都在“不计成本”地抢占21世纪制高点。美国在走向“第一科技强国”的路上,有两个不容忽视的里程碑,1941年罗斯福提出的“曼哈顿计划”和1961年肯尼迪提出的“阿波罗计划”,前者通过原子弹树立头号强国地位,后者反超前苏联实现人类登月,都极大推动了经济发展、科研突破、民族自信心。

时至今日,推崇“让美国再次伟大”的特朗普在第二任任期内,很有可能采纳美中经济与安全审查委员会提出的AGI“曼哈顿计划”,即政府牵引投资通用人工智能研发突破,公共投入不少于国家GDP 0.8%的庞大金额,按照2024年经济规模计算相当于2190亿美元,再加上来自硅谷科技巨头、华尔街金融体系的民间投资,AGI科研投入可能超过万亿美元。另一种可能性,如果AGI潜在价值继续扩大,美国可能按照“阿波罗登月”1.6%的GDP比例投资,即4379亿美元的AGI公共科研投资。

AGI时刻就是“奥本海默时刻”。当一项科学发现、技术突破会对社会、伦理以及人类自身产生极其深远的影响,这一时间点被称为“奥本海默时刻”。当通用人工智能拥有了超过人类的智能时会发生什么?正如在电影《奥本海默》结尾时,爱因斯坦与奥本海默推算出原子弹的“链式反应”,已经能够毁灭地球的可能性时,奥本海默不禁感慨:“我相信我们做到了。”

当然作为技术加速主义者的OpenAI创始人奥尔特曼给我们规划了一个“AGI乌托邦”,他在2021年《万物摩尔定律》一文中提出了AGI时代前后的挑战与机遇。在AGI时刻之前,几十年来,摩尔定律推动芯片大约每两年以相同价格变得性能翻倍。过去几十年,美国的电视、电脑和娱乐成本下降,但住房、医疗保健和高等教育等成本显著上升。如果这些成本继续飙升,仅财富再分配是行不通的。而人类步入AGI时刻之后,“想象一个世界,几十年来,住房、教育、食物、服装等所有东西大约每两年价格减半。技术革命后总会出现新工作,而且由于另一边的富足,人们将有极大的自由去创造这些工作。“当自主化机器人生产一切商品、开采资源,并且机器人自动化生产机器人,所有商品成本将逼近于原材料价格,而所有服务成本将接近于能源价格,最终带来物质极大丰富、人类创新时间自由,这就是奥尔特曼眼中的“万物摩尔定律”。

而在技术加速主义者的对立面,则出现了一群以毁灭新兴技术为使命的卢德主义者。18世纪第一次工业革命期间,英国莱斯特地区一位名叫内德·卢德的织布工学徒被雇主责骂后,拿起锤子捣毁了纺织机器。在卢德主义者兴起的1811至1816年,诺丁汉郡暴徒们的主要攻击目标是针织机,卢德主义者们至少开展了100次单独行动,捣毁了约1000台机器,它们价值6000-10000英镑。“AGI时刻”的到来,是会给更多人带来薪酬福利的上升、工作岗位的增加、社会技能培训升级,还是让更多人失业、降薪,决定了是否会涌现大量卢德主义者阻碍生产力进步,人工智能的普惠价值应造福于全人类,而不是少数人,以人为本主义者将弥补科技加速主义者与卢德主义者之间的巨大鸿沟。

当“奥本海默时刻”到来的过程中,人类也将出现“大分流”。当很多人按照情绪不假思索地接受别人的观点而非思考过程逻辑,不对AI给的答案进行质疑与独立思考时,AI生成的海量低质量“思维垃圾”将像快餐一样训练出“超级笨蛋”人类群体,成为对AI言听计从的“奴隶”;与之对应的是,具有批判性思维、善于发现问题、有能力鉴定AI答案专业性和正确性的一群人,将把AGI作为超级助手,成长为“超级智人”,在做出比以往任何时代都伟大的壮举。

人类该如何直面“AGI时刻”?推荐《奥尔特曼传》畅销书,一个有趣的思想实验是哲学家尼克·博斯特罗姆提出的“回形针预言”——假设一个人工智能被赋予了尽可能多地制造回形针的唯一任务,那么它可能会在无意中消灭全人类以完成其任务。

AI产业革新

依靠“科技群落木桶”

走向通用人工智能AGI的科研路径,是由一个科技群落组成,包括多智能体协同网络、大语言模型、小语言模型、因果AI、群体AI等组成的“AGI木桶”,缺一不可。新一代人工智能具有5大特性:

(1) 自主“思考”如何完成任务;

(2) 在决定采取最佳行动之前,评估各种 “假如” 情况;

(3) 在解决问题时,理解它们行为的影响;

(4) 能够理解自身行为“如何做”和“为什么做”;

(5) 各领域小语言模型驱动任务,并与大语言模型协同合作。

AI产业革新是按照“新基建”、“新系统”、“新终端”、“新服务”四阶段的发展路径演进的,简单来讲就是“AI产业化,产业AI化”。

(1) 第一波产业浪潮,是以AI专属算力、数据为核心的智能新基建。通过重资本投资大规模升级换代数字化公共基础设施,这一过程伴随着基建成本价格的持续降低,参考1G到5G通讯资费的降价带来市场需求爆发。

(2) 第二波产业浪潮,是以大模型为核心的新型操作系统。从云上到终端一体协同的“AI大脑”基础能力持续提升,逼近人类智能临界点,成为所有应用软件的共同基础。

(3) 第三波产业浪潮,是个人用得起的AI新终端社会化普及。首先是PC、手机与可穿戴配件的AI换代,包括AI PC、AI手机、AI耳机、AI眼镜、AI手表等;伴随计算芯片、终端电池的升级,新型AI终端陆续推广,包括智能车舱、无人机、机器狗、人形机器人等独立运算的终端设备,成为新型生产力工具。

(4) 第四波产业浪潮,以智能体提供跨领域综合服务、专业服务。例如办公、编程、客服、医疗、教育、驾驶等智能体,成为跨APP的新服务入口,AI应用市场吸引更多开发者加入,互联网与线下商业的格局将迎来全新格局与AI平台重构。

AI产业革命从商业领域上看,有四个发展方向:一是“互联网AI化”、“传统软件AI化”、“传统服务AI化”、“硬件AI化”,详细内容参见下图。以互联网AI化为例,搜索、游戏、视频直播、社交网络、电商等商业模式,都正在被生成式AI、AI虚拟角色、智能体等技术所重构,下一代互联网应用并不是超级应用,而是超级服务。

以大模型为代表的人工智能2.0产业化革命,推荐阅读笔者2025年春节后出版的《AI商业进化论》,一言以蔽之——“人工智能的上半场是‘知识工程’,下半场是‘工业革命’。”

第四次工业革命

实现自动化与规模化

智能化牵引的第四次工业革命,必须回答两个关键命题:一是人工智能的科技演进路线,二是人工智能如何创造新商业价值。综合分析,前者按照“认知AI”、“物理AI”、“AGI”(通用人工智能)三浪叠加实现技术进步,后者按照“超级系统”、“超级产品”、“超级服务”实现商业价值跃迁。智能化的本质就是先实现“自动化”,再实现“规模化”。

展开来看,“认知AI”能够逐步解决一部分基础脑力劳动,“物理AI”能够推动新质生产力革新,最终通过AGI完成高复杂度、高逻辑性、大规模的绝大部分人类工作,人类转移向挑战性更强、创造力更强的新发展阶段。

群体智能解决单体智能的瓶颈问题。人类的脑化商数在大约 9 万年前达到顶峰,最近 5000 年还有10% 的减少。为了持续提升人脑的智力,人类很早就开始通过社会性、产业性的分工协作、知识数据存储实现一定程度的群体智能。人工智能同样在快速提升单体智能(大模型)与群体智能(智能体协同网),例如全球700万辆特斯拉电动车之间的智能驾驶群体技能学习,以及2025年将会推出的Robotaxi车队、Optimus机器人也是2种商业场景下的通用驾驶、通用生产群体智能,其背后的原因如下:

(1) 加速收集高质量数据,加速认知物理规律;

(2) 加速找到复杂环境下复杂任务的更优解;

(3) 加速迭代优质服务,加速吸引更多用户。

无群体,不智能。尤瓦尔·赫拉利在《智人之上》一书中写到:“人类之所以喜欢召唤自己控制不了的力量,问题不在于个人的心理,而在于人类在大规模合作时的一种特性(大规模合作网络)。”

人口巨变

“世界工厂”升级“智能工厂”

根据联合国人口署数据显示,2022年中国50%的人口年龄超过38.5岁,实质上进入“大龄劳动力时代”。不只是中国,而是全球大部分地区都将进入老龄化社会,《柳叶刀》杂志上的一项最新研究预计,到2050年,全球204个国家和地区中,有155个经济体(占比76%)的生育率,将低于人口更替水平。到2100年,这一数量将进一步上升至198个国家和地区——即总数的97%。2024年亚洲地区的印度人口已经超过中国人口(中国14.25亿人,印度14.35亿人),预计到2050年,印度平均年龄约36岁,中国则是49岁,中国将在2040年前实现“人口达峰”。未来50年,我们无法依赖人力密集型产业结构保持领先地位,人工智能+新质生产力是必由之路。

未来的人口密集区域不止是印度,更多新生儿诞生在非洲。据人口研究人员分析,到本世纪末,超过四分之三(75%)的新生儿将出生在低收入和中等偏下收入国家,其中超过一半(50%)将出生在撒哈拉以南的非洲。所以通过中国遍布全球的新型智能工厂,向“一带一路”的中低收入国家提供质优价廉的个性化商品与服务,成为经济发展的关键战略。

另一方面,人口下降也会带来部分领域人工智能训练数据规模的缩小,所以数据贸易、合成数据等新领域值得深入拓展。

人口不仅是劳动力,更是创新力。仿生机器人能够极大缓解老龄化社会的劳动力缺口,而科学智能(AI for Science)则能够显著增强我国基础科研力量的不足。在此推荐梁建章《人口战略》畅销书,该书率先提出”创新力 = 人口数量 x 人口能力 x (内部交流量+外部交流量) “公式,人口能力指的是国家或地区的人群平均能力水平,内部/外部交流量指的是科技、贸易等国际交流。

全球人才 + 全球科研 = AI竞争力

百年未有之大变局中,中国在“修路”,一带一路贸易共同繁荣,而美国在“建墙”,以“卡脖子”战略脱钩断链,科技产业链从全球化转向区域化、友岸化,全球科研合作生态面临重大挑战。中国以开放包容原则携手世界各国共同发展,一带一路、金砖国家、上合组织,人才、科技、产业链、市场逐步融为一体,构筑起21世纪的“人类命运共同体”,共同繁荣发展。

人工智能短期看算力,中期看数据,长期看人才,人才是一切创新的源头,科技强国必然是人才强国。中国在全球化贸易基础上,应借鉴全球科技名校,建立起世界一流的AI研究生、博士生教育体系,吸引华人科学家、国际领军科学家、培养青年科学家的科研教学队伍。另一方面,为AI创新人才打造最自由、最有成就感的基础科研发展空间,保障原创AI的科研工作者有饭吃、生活无忧,没有繁文缛节和上升天花板。国际方面,在人类命运共同体的生态圈中,设立人工智能国际基础科研中心,前沿领域的AI跨学科交流是最好的催化剂。

来源:人工智能学家

相关推荐