如虚如实说｜人工智能的里程碑

摘要：近两年来，人工智能技术非常热门，被称为“第四次工业革命”。在第一次工业革命（18世纪60年代开始）和第二次工业革命（19世纪60年代开始）时代，作为科学界最高奖的诺贝尔奖还不存在（诺贝尔奖从1901年开始）。

近两年来，人工智能技术非常热门，被称为“第四次工业革命”。在第一次工业革命（18世纪60年代开始）和第二次工业革命（19世纪60年代开始）时代，作为科学界最高奖的诺贝尔奖还不存在（诺贝尔奖从1901年开始）。

第三次工业革命（1950年代）是从晶体管的发明开始的，因此约翰·巴丁（John Bardeen，1908年—1991年）、沃尔特·布拉顿（Walter Brattain，1902年—1987年）和威廉·肖克利（William Shockley，1910年—1989年）荣获1956年的诺贝尔物理学奖。所以可以预测人工智能技术也会获得诺贝尔奖。但是谁能获奖呢？

人工智能的第一个里程碑是1956年的达特茅斯会议（Dartmouth Summer Research Project on Artificial Intelligence）。当时刚到达特茅斯大学任教不久的约翰·麦卡锡（John McCarthy，1927年—2011年）向洛克菲勒基金会申请到了一笔经费，召开了一个为期两个月的研讨会（图1）。与会者共有10人，其中最著名的是香农（Claude Shannon,1916年—2001年，参见《「如虚如实说」| 编码与信息》）。

图1，1956年的达特茅斯会议是人工智能技术的里程碑

50年后的2006年，当年参会的人只剩下一半（图2），其中还有人去了经商，有人转到了别的研究方向。而到了2024年的11月，所有的与会者都已不在了。

图2，2006年当年达特茅斯会议的与会者重逢

达特茅斯会议不但定义了什么是人工智能，而且还拟定了一个以逻辑决策为核心的路线图。

到了20世纪80年代，各种各样的人工智能算法百花齐放、百家争鸣，我们曾经介绍过五类算法：

01《广东科学中心「院士说」 | 人工智能算法之一：贝叶斯算法》；

02《》；

03《》；

04《》；

05《》。

贝叶斯算法源自18世纪。它的模型过于简单，难以处理复杂问题（如翻译、图像识别、下棋等）。现在多用于数据清洗。

逻辑决策的思想是建立一套严谨的逻辑学方法，然后把复杂问题分而治之。不过，逻辑不是完备的，会产生自相矛盾的结果。例如罗素（Bertrand Russell，1872年—1970年）的理发师悖论：理发师只为所有不给自己刮脸的人刮脸，那么他是不是应该为自己刮脸？这一悖论无解。从1950年代开始，许多著名的科学家们费尽心机，一方面开发出逻辑学的“机器证明”方法，一方面建立知识图谱。另外还建立了各种各样旨在解决实际问题的专家系统（Expert System），但效果并不理想（我也曾经努力去建立一个金属切削过程的专家系统）。后来计算机学家们转向从数据中学习决策规则（决策树法及随机森林法），这一方法虽然会产生一些误差。但由于它简单，计算量小，今天还在使用。

遗传算法是由我的母校密西根大学的约翰·霍兰（John Holland，1929年—2015年）教授提出的。它与集群智能（Swarm Intelligence）算法（如蜂群法、蚁群法、布谷鸟法等）同属自然选择优化法（nature-inspired optimization）算法。这类方法适应性强，但必须首先定好模型，然而这对于复杂问题恰恰是最困难的。霍兰教授晚年致力于研究复杂系统的建模方法。近年来还有许多人在继续这个方向的研究。

模式识别法在20世纪90年代有过突破，但其模型难以描述复杂系统。近年来已经不是主流。

神经元网络最早出现在20世纪40年代。从20世纪80年代开始不断有所突破。到了21世纪初已成一花独秀之势。因此，人工智能的诺贝尔奖当属于研发神经元网络的科学家。

2024年10月，诺贝尔物理学奖揭晓，约翰·霍普菲尔德（John J. Hopfield，1933年—）和杰弗里·辛顿（Geoffrey E. Hinton，1947年—）获得这一殊荣（图3）。

霍普菲尔德是第一代研发神经元网络的科学家（图3（左））。他在康奈尔大学获得博士学位，曾在贝尔实验室、加州大学伯克利分校、普林斯顿大学、加州理工学院等处工作。他于2013年退休，今年91岁。

图3，霍普菲尔德（左图）和辛顿（右图）荣获2024年诺贝尔物理学奖

辛顿出生在英国（图3（右）），他的曾祖父是著名的逻辑学家乔治·布尔（George Boole，1815年—1864年）。他的祖父和父亲都是知名学者。他的姑姑是美国曼哈顿计划（参见《如虚如实说丨什么是核聚变？终极能源会变成现实吗？》）中不多的几位女性科学家之一，因为是美国共产党党员，她曾经遭到美国联邦调查局的调查。

1970年辛顿在剑桥大学获得学士学位，接着做了两年的木工，然后回到学校继续读书；

1978年辛顿在爱丁堡大学获得博士学位并赴美国工作。他先后在加州大学圣地亚哥分校和卡内基—梅隆大学任教；

1987年辛顿为反对美国军方和政府把人工智能技术军事化，离开美国前往加拿大多伦多大学任教；

2012年他和他的两个学生（Alex Krizhevsky和Ilya Sutskever）研发出了一个用于图像识别的神经网络软件。当时这个软件的精度比其他软件都高出12%以上。因此三人创建了一家公司。公司随即被谷歌公司以4400万美元的高价收购；

2013年辛顿加入了谷歌的人工智能研究团队“谷歌大脑”（Google Brain），后来还任副总裁；

2023年，他认为人工智能有不可控的危险。他想仗义执言，但又有碍于职责，因此辞职。

霍普菲尔德和辛顿

凭什么获得诺贝尔物理学奖呢？

顾名思义，神经元网络是由神经元组成的网络。因此神经元网络有四个要素（图4）：神经元（component）（在图中用蓝色表示），神经元的连接方式，包括前馈（feedforward）（粉红色）和重复（recurrent）（黄色），以及优化计算方法（Optimiser）（绿色）。据此科学家们已经开发出了各种各样的神经元网络（图4）

图4，神经元网络的里程碑

霍普菲尔德在20世纪60年代首先使用多层结构（multi-layer perceptron）的连接方式，到了20世纪80年代又研发出了反向传播（backpropagation）的优化设计方法，一举解决了人工智能的创始人之一马文·明斯基（Marvin Minsky,1927年—2016年）（参见图1、2）当年提出的神经元网络不能解决简单逻辑计算的挑战。后来他又研发出了的“霍普菲尔德网络”（Hopfield Recurrent Neural Network，简称Hopfield RNN）。

辛顿在20世纪80年代研发出卷积（Convolution）神经元，20世纪90年代研发出卷积神经元网络（Convolution Neural Network，CNN），21世纪10年代又研发出深度卷积神经元网络（Deep Convolution Neural Network，又称AlexNet），这些都是神经元网络的重大突破。此外辛顿育人有方，有好几位非常成功的学生。例如Alex Krizhevsky发明了“Dropout”神经元，Ilya Sutskever是OpenAI公司的总工程师。两人都为当今最热门的Chat-GPT做出了重大贡献。因此辛顿被誉为人类智能领域的“教父”。2018年辛顿获得了计算机领域的最高奖项—图灵奖。

管理诺贝尔奖的瑞典皇家科学院说霍普菲尔德和辛顿“为基于神经元网络的机器学习做出了奠基性的发现与发明（for foundational discoveries and inventions that enables machine learning with artificial neural networks）”确实是实至名归。

人工智能在各行各业中都有许多应用。但最为重要、最为困难的应用要数蛋白质折叠。我们在《如虚如实说 | 解密人类“生老病死”，从细胞研究中说起》系列中讲述了生命的构成（图5）：人体是由细胞组成的。细胞中有DNA，DNA携带的基因通过信使RNA（mRNA）表达，接着生成蛋白质，进而构建成细胞。人体的蛋白质至少有10万种，例如血红蛋白在身体中循环输送氧气，角蛋白为头发、指甲和皮肤制作框架，胰岛素作为激素蛋白协助葡萄糖进入细胞内转化为能量......

自然界中的蛋白质更是多达上亿种，功能各异。DNA以碱基对的形式连接成双螺旋型的长链形成基因结构，因此可以看作的2维序列。蛋白质通过氨基酸肽链的折叠形成复杂的3维空间结构，所以能完成各种各样复杂的功能。把2维的基因变成3维的蛋白质就是蛋白质折叠了（图6）。

图5 人体由细胞组成。细胞中有DNA，DNA通过mRNA表达生成蛋白质，各种各样蛋白质构造出不同细胞，组成人体

图6，蛋白质折叠动画

最早发现蛋白质会按一定的规律折叠是美国科学家克里斯蒂安·安芬森（Christian B. Anfinsen, 1916年—1995年），他也因此获得了1972年的诺贝尔化学奖。

蛋白质折叠是个动态过程，非常复杂。时至1984年，科学家们仅搞清楚了152种蛋白质的结构。到了1992年，也只有747个。因此科学家们开始尝试用计算机来进行仿真计算。1996年，美国科学家大卫·贝克（David Baker，1962年—）研发出了一套算法“罗塞塔”（Rosetta）。这个名字源自破解古埃及文的罗塞塔石碑（参见《如虚如实说 | 你知道光是怎么传播的吗？》）。他证明了计算机仿真方法确实行之有效。2016年谷歌的“DeepMind”团队开始参与蛋白质折叠的计算。2020年谷歌的深度学习网络“AlphaFold2”一鸣惊人，它可以准确地计算出蛋白质的结构及功能。2021年谷歌公布了AlphaFold2的底层代码。到了2022年，谷歌又发布了2.18亿个蛋白质的结构及功能预测，一举改变整个领域。据此科学家们可以使用这个工具分析病因，开发新药，抗击病原体，改善环境。

2024年的诺贝尔化学奖授予大卫·贝克，以及谷歌DeepMind的总经理戴密斯·哈萨比斯（Demis Hassabis，1976年—）和项目负责人约翰·江柏（John Jumper，1985年—）以奖励他们为预测蛋白质的结构和功能，进而为改善健康与环境所做出的非凡贡献（for predicting protein shapes and functions — and for creating entirely new ones that can improve health and the environment）。

大卫·贝克在哈佛大学获得生物学的学士学位，在加州大学伯克利分校获得生物化学的博士学位，现在华盛顿大学工作。

戴密斯·哈萨比斯是“70后”。他从小喜欢下棋和计算机编程。他在剑桥大学获得计算机的学士学位后开始创业。几年后他卖掉了自己的公司回到伦敦大学（University College London）攻读认知科学的博士。毕业后曾到哈佛大学及麻省理工学院做博士后。2011年他回到伦敦与朋友们创立了“DeepMind”公司。2014年公司被谷歌收购，他留任总经理。2016年，谷歌DeepMind的“AlphaGo”一举击败世界顶尖棋手。

约翰·江柏是“80后”。他在范德比尔特大学（Vanderbilt University）获得数学与物理学学士，在芝加哥大学获得化学博士学位。2018年加入谷歌DeepMind。

同一年中两个诺贝尔奖归于人工智能，这是人工智能的里程碑。可以预测人工智能技术在未来的几年中会有更多的应用与突破。

最后还要一提的是蛋白质折叠是由微小RNA（microRNA）来控制的。2024年的诺贝尔生理学与医学奖授予发现了这个机制的两位学者维克托·安布罗斯（Victor Ambros）和加里·鲁夫昆（Gary Ruvkun）。

来源：杜如虚院士

标签：人工智能辛顿蛋白质折叠

本文地址：https://news.43u.com.cn/a/49993.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!