如虚如实说|人工智能的里程碑

摘要:近两年来,人工智能技术非常热门,被称为“第四次工业革命”。在第一次工业革命(18世纪60年代开始)和第二次工业革命(19世纪60年代开始)时代,作为科学界最高奖的诺贝尔奖还不存在(诺贝尔奖从1901年开始)。

近两年来,人工智能技术非常热门,被称为“第四次工业革命”。在第一次工业革命(18世纪60年代开始)和第二次工业革命(19世纪60年代开始)时代,作为科学界最高奖的诺贝尔奖还不存在(诺贝尔奖从1901年开始)。

第三次工业革命(1950年代)是从晶体管的发明开始的,因此约翰·巴丁(John Bardeen,1908年—1991年)、沃尔特·布拉顿(Walter Brattain,1902年—1987年)和威廉·肖克利(William Shockley,1910年—1989年)荣获1956年的诺贝尔物理学奖。所以可以预测人工智能技术也会获得诺贝尔奖。但是谁能获奖呢?

人工智能的第一个里程碑是1956年的达特茅斯会议(Dartmouth Summer Research Project on Artificial Intelligence)。当时刚到达特茅斯大学任教不久的约翰·麦卡锡(John McCarthy,1927年—2011年)向洛克菲勒基金会申请到了一笔经费,召开了一个为期两个月的研讨会(图1)。与会者共有10人,其中最著名的是香农(Claude Shannon,1916年—2001年,参见《「如虚如实说」| 编码与信息》)。

图1,1956年的达特茅斯会议是人工智能技术的里程碑

50年后的2006年,当年参会的人只剩下一半(图2),其中还有人去了经商,有人转到了别的研究方向。而到了2024年的11月,所有的与会者都已不在了。

图2,2006年当年达特茅斯会议的与会者重逢

达特茅斯会议不但定义了什么是人工智能,而且还拟定了一个以逻辑决策为核心的路线图。

到了20世纪80年代,各种各样的人工智能算法百花齐放、百家争鸣,我们曾经介绍过五类算法:

01广东科学中心「院士说」 | 人工智能算法之一:贝叶斯算法》;

02《》;

03《》;

04《》;

05《》。

贝叶斯算法源自18世纪。它的模型过于简单,难以处理复杂问题(如翻译、图像识别、下棋等)。现在多用于数据清洗。

逻辑决策的思想是建立一套严谨的逻辑学方法,然后把复杂问题分而治之。不过,逻辑不是完备的,会产生自相矛盾的结果。例如罗素(Bertrand Russell,1872年—1970年)的理发师悖论:理发师只为所有不给自己刮脸的人刮脸,那么他是不是应该为自己刮脸?这一悖论无解。从1950年代开始,许多著名的科学家们费尽心机,一方面开发出逻辑学的“机器证明”方法,一方面建立知识图谱。另外还建立了各种各样旨在解决实际问题的专家系统(Expert System),但效果并不理想(我也曾经努力去建立一个金属切削过程的专家系统)。后来计算机学家们转向从数据中学习决策规则(决策树法及随机森林法),这一方法虽然会产生一些误差。但由于它简单,计算量小,今天还在使用。

遗传算法是由我的母校密西根大学的约翰·霍兰(John Holland,1929年—2015年)教授提出的。它与集群智能(Swarm Intelligence)算法(如蜂群法、蚁群法、布谷鸟法等)同属自然选择优化法(nature-inspired optimization)算法。这类方法适应性强,但必须首先定好模型,然而这对于复杂问题恰恰是最困难的。霍兰教授晚年致力于研究复杂系统的建模方法。近年来还有许多人在继续这个方向的研究。

模式识别法在20世纪90年代有过突破,但其模型难以描述复杂系统。近年来已经不是主流。

神经元网络最早出现在20世纪40年代。从20世纪80年代开始不断有所突破。到了21世纪初已成一花独秀之势。因此,人工智能的诺贝尔奖当属于研发神经元网络的科学家。

2024年10月,诺贝尔物理学奖揭晓,约翰·霍普菲尔德(John J. Hopfield,1933年—)和杰弗里·辛顿(Geoffrey E. Hinton,1947年—)获得这一殊荣(图3)。

霍普菲尔德是第一代研发神经元网络的科学家(图3(左))。他在康奈尔大学获得博士学位,曾在贝尔实验室、加州大学伯克利分校、普林斯顿大学、加州理工学院等处工作。他于2013年退休,今年91岁。

图3,霍普菲尔德(左图)和辛顿(右图)荣获2024年诺贝尔物理学奖

辛顿出生在英国(图3(右)),他的曾祖父是著名的逻辑学家乔治·布尔(George Boole,1815年—1864年)。他的祖父和父亲都是知名学者。他的姑姑是美国曼哈顿计划(参见《如虚如实说丨什么是核聚变?终极能源会变成现实吗?》)中不多的几位女性科学家之一,因为是美国共产党党员,她曾经遭到美国联邦调查局的调查。

1970年辛顿在剑桥大学获得学士学位,接着做了两年的木工,然后回到学校继续读书;

1978年辛顿在爱丁堡大学获得博士学位并赴美国工作。他先后在加州大学圣地亚哥分校和卡内基—梅隆大学任教;

1987年辛顿为反对美国军方和政府把人工智能技术军事化,离开美国前往加拿大多伦多大学任教;

2012年他和他的两个学生(Alex Krizhevsky和Ilya Sutskever)研发出了一个用于图像识别的神经网络软件。当时这个软件的精度比其他软件都高出12%以上。因此三人创建了一家公司。公司随即被谷歌公司以4400万美元的高价收购;

2013年辛顿加入了谷歌的人工智能研究团队“谷歌大脑”(Google Brain),后来还任副总裁;

2023年,他认为人工智能有不可控的危险。他想仗义执言,但又有碍于职责,因此辞职。

霍普菲尔德和辛顿

凭什么获得诺贝尔物理学奖呢?

顾名思义,神经元网络是由神经元组成的网络。因此神经元网络有四个要素(图4):神经元(component)(在图中用蓝色表示),神经元的连接方式,包括前馈(feedforward)(粉红色)和重复(recurrent)(黄色),以及优化计算方法(Optimiser)(绿色)。据此科学家们已经开发出了各种各样的神经元网络(图4)

图4,神经元网络的里程碑

霍普菲尔德在20世纪60年代首先使用多层结构(multi-layer perceptron)的连接方式,到了20世纪80年代又研发出了反向传播(backpropagation)的优化设计方法,一举解决了人工智能的创始人之一马文·明斯基(Marvin Minsky,1927年—2016年)(参见图1、2)当年提出的神经元网络不能解决简单逻辑计算的挑战。后来他又研发出了的“霍普菲尔德网络”(Hopfield Recurrent Neural Network,简称Hopfield RNN)。

辛顿在20世纪80年代研发出卷积(Convolution)神经元,20世纪90年代研发出卷积神经元网络(Convolution Neural Network,CNN),21世纪10年代又研发出深度卷积神经元网络(Deep Convolution Neural Network,又称AlexNet),这些都是神经元网络的重大突破。此外辛顿育人有方,有好几位非常成功的学生。例如Alex Krizhevsky发明了“Dropout”神经元,Ilya Sutskever是OpenAI公司的总工程师。两人都为当今最热门的Chat-GPT做出了重大贡献。因此辛顿被誉为人类智能领域的“教父”。2018年辛顿获得了计算机领域的最高奖项—图灵奖。

管理诺贝尔奖的瑞典皇家科学院说霍普菲尔德和辛顿“为基于神经元网络的机器学习做出了奠基性的发现与发明(for foundational discoveries and inventions that enables machine learning with artificial neural networks)”确实是实至名归。

人工智能在各行各业中都有许多应用。但最为重要、最为困难的应用要数蛋白质折叠。我们在《如虚如实说 | 解密人类“生老病死”,从细胞研究中说起》系列中讲述了生命的构成(图5):人体是由细胞组成的。细胞中有DNA,DNA携带的基因通过信使RNA(mRNA)表达,接着生成蛋白质,进而构建成细胞。人体的蛋白质至少有10万种,例如血红蛋白在身体中循环输送氧气,角蛋白为头发、指甲和皮肤制作框架,胰岛素作为激素蛋白协助葡萄糖进入细胞内转化为能量......

自然界中的蛋白质更是多达上亿种,功能各异。DNA以碱基对的形式连接成双螺旋型的长链形成基因结构,因此可以看作的2维序列。蛋白质通过氨基酸肽链的折叠形成复杂的3维空间结构,所以能完成各种各样复杂的功能。把2维的基因变成3维的蛋白质就是蛋白质折叠了(图6)。

图5 人体由细胞组成。细胞中有DNA,DNA通过mRNA表达生成蛋白质,各种各样蛋白质构造出不同细胞,组成人体

图6,蛋白质折叠动画

最早发现蛋白质会按一定的规律折叠是美国科学家克里斯蒂安·安芬森(Christian B. Anfinsen, 1916年—1995年),他也因此获得了1972年的诺贝尔化学奖。

蛋白质折叠是个动态过程,非常复杂。时至1984年,科学家们仅搞清楚了152种蛋白质的结构。到了1992年,也只有747个。因此科学家们开始尝试用计算机来进行仿真计算。1996年,美国科学家大卫·贝克(David Baker,1962年—)研发出了一套算法“罗塞塔”(Rosetta)。这个名字源自破解古埃及文的罗塞塔石碑(参见《如虚如实说 | 你知道光是怎么传播的吗?》)。他证明了计算机仿真方法确实行之有效。2016年谷歌的“DeepMind”团队开始参与蛋白质折叠的计算。2020年谷歌的深度学习网络“AlphaFold2”一鸣惊人,它可以准确地计算出蛋白质的结构及功能。2021年谷歌公布了AlphaFold2的底层代码。到了2022年,谷歌又发布了2.18亿个蛋白质的结构及功能预测,一举改变整个领域。据此科学家们可以使用这个工具分析病因,开发新药,抗击病原体,改善环境。

2024年的诺贝尔化学奖授予大卫·贝克,以及谷歌DeepMind的总经理戴密斯·哈萨比斯(Demis Hassabis,1976年—)和项目负责人约翰·江柏(John Jumper,1985年—)以奖励他们为预测蛋白质的结构和功能,进而为改善健康与环境所做出的非凡贡献(for predicting protein shapes and functions — and for creating entirely new ones that can improve health and the environment)。

大卫·贝克在哈佛大学获得生物学的学士学位,在加州大学伯克利分校获得生物化学的博士学位,现在华盛顿大学工作。

戴密斯·哈萨比斯是“70后”。他从小喜欢下棋和计算机编程。他在剑桥大学获得计算机的学士学位后开始创业。几年后他卖掉了自己的公司回到伦敦大学(University College London)攻读认知科学的博士。毕业后曾到哈佛大学及麻省理工学院做博士后。2011年他回到伦敦与朋友们创立了“DeepMind”公司。2014年公司被谷歌收购,他留任总经理。2016年,谷歌DeepMind的“AlphaGo”一举击败世界顶尖棋手。

约翰·江柏是“80后”。他在范德比尔特大学(Vanderbilt University)获得数学与物理学学士,在芝加哥大学获得化学博士学位。2018年加入谷歌DeepMind。

同一年中两个诺贝尔奖归于人工智能,这是人工智能的里程碑。可以预测人工智能技术在未来的几年中会有更多的应用与突破。

最后还要一提的是蛋白质折叠是由微小RNA(microRNA)来控制的。2024年的诺贝尔生理学与医学奖授予发现了这个机制的两位学者维克托·安布罗斯(Victor Ambros)和加里·鲁夫昆(Gary Ruvkun)。

来源:杜如虚院士

相关推荐