摘要:冯·诺依曼和摩根斯坦虽然开创了现代博弈论,提出重要的“极小化极大原理”,但面对错从复杂的经济行为,他们的多人博弈理论并未起到多大作用。而后来有三位天才数学家们真正使博弈论迈向实用,他们最终都获得了诺贝尔奖。
冯·诺依曼和摩根斯坦虽然开创了现代博弈论,提出重要的“极小化极大原理”,但面对错从复杂的经济行为,他们的多人博弈理论并未起到多大作用。而后来有三位天才数学家们真正使博弈论迈向实用,他们最终都获得了诺贝尔奖。
撰文 | 王善平
什么样的人才有资格被称为数学家?在数学高度抽象发展的今天,也许会有很多人认为只有数学专业的博士才(勉强)够得上这一称号。按照此标准,这里所介绍的有些人算不上是数学家,因为他们可能连数学系本科都没有读过。但国际数学联盟曾经规定,一个人只要有两篇及以上的论文被《数学评论》评论过,就可以被收入《世界数学家名录》。根据这个规定,这里所介绍的人都完全够得上数学家的称号。
一
“世事如棋”,这句古语恰当地形容了人类在社会活动中彼此争斗的一面,这种争斗在军事、政治、外交、经济、体育竞技等领域尤为突出。争斗的参与者可以是个人、团体和国家,争斗对手可以是双方或者多方。虽然争斗的内容和形式千变万化,但都与下棋有相通之处,那就是要遵守一定的规则并讲究制胜策略,故常以“对局”或“博弈”来代指人们的各种争斗。所谓策略就是博弈者根据自己和对手的情况以及当前的局面,为获取自身利益而采取的行动步骤。以策略制胜的一个典型例子就是发生在战国时代的“田忌赛马”。
1944年,美籍匈牙利裔数学家冯·诺依曼与奥地利经济学家摩根斯坦(Oskar Morgenstern, 1902-1977)合作出版了巨著《博弈论与经济行为》(Theory of Games and Economic Behavior),这标志着现代博弈论的诞生。该书的主要成就包括:
(1)明确了博弈论是一门运用数学方法研究博弈者策略之间相互作用的学科。
(2)提出了“混合策略”的概念,它是通常策略(“纯策略”)的概率组合;此概念揭示了博弈者为迷惑对手以不确定方式出牌的行为;另一方面,所有的混合策略构成了欧氏空间中的“凸集”,从而能够运用分析和拓扑等数学工具进行有效处理。
(3)提出了“零和”(zero-sum)博弈的概念,即博弈者任何一方所“得”必然会引起对手之“失”,得失总相等;包括体育竞技在内的大部分博弈都可归结为“零和博弈”。
(4)运用“极小化极大原理”证明,在两人零和博弈中,存在一个最优的策略组合,它使博弈者双方均获得最低利益保障:任何一方若要偏离此策略,都将减少自己的收益并增加对手的收益。这一结果被称为“极小化极大原理”(Minimax principle,博弈者每步行动都是试图从最坏的局面中找出最好的结果,这个最坏的结局是由于其对手在上一步行动中采用同样的原理而造成的),是该书的核心内容。
(5)研究了不同情况下的“多人博弈”,特别是有若干参加者结成联盟的多人博弈,得出一些结论,但并没有得到如“两人零和博弈”中那样深刻的原理。
凭借冯·诺依曼本人作为20世纪杰出数学家的声望,《博弈论与经济行为》的出版当时曾引起强烈的反响。人们期望它将把经济学变成像物理学那样的科学,能够用冯·诺依曼提供的数学工具解决其中的大部分问题。然而事实是,面对错综复杂的各种经济局面,以“极小化极大原理”为核心的博弈论并无多大作为。
兰德公司(RAND Corporation)是美国著名的民间智库机构,它对博弈论极为推崇。1952-1954年,兰德公司曾经进行了一系列实验研究,以检验冯·诺依曼的多人博弈理论,结果并没有发现该理论有什么实际作用。
直到由另一位传奇数学家——纳什(John Forbes Nash Jr. , 1928—2015),在不经意间完成了新的理论突破,才为博弈论真正开辟了一片广阔的应用新天地。
二
纳什丨图片来源:Charles Rex Arbogast/AP
纳什出生于美国西弗吉尼亚州布鲁菲尔德,父亲是参加过第一次世界大战的老兵,退伍后在一家电力公司当工程师;母亲在结婚前是一所学校的英语和拉丁语教师。纳什是长子,下面还有一个比他小两岁半的妹妹,名叫马莎(Martha)。马莎后来回忆他哥哥小时候的情形时说道:“乔尼总是与众不同,做事总要按自己的一套方法。父母知道这一点,也知道他很聪明。母亲坚持要我把他拉进我的朋友圈里,而我并不太愿意把这位有点怪怪的哥哥介绍给大家。”
纳什在宽松的家庭环境中受到了良好的教育。还在上幼儿园的时候,父母亲就给他买了一套《康普顿百科全书》,他从中学习了许多知识。他还阅读了自己家以及外祖母家里的许多藏书。13岁时,他开始在自己的房间里做科学实验。
上中学时,纳什看了贝尔的名著《数学大师》(Men of Mathematics),首次激发起他对数学的兴趣。当读到其中关于费马的故事时,他就自己尝试证明其中提到的费马小定理并获得成功。
纳什曾经想成为像父亲那样的电气工程师,但他后来赢得全额奖学金,来到匹兹堡的卡内基梅隆大学学习化学。因为不喜欢机械制图和化学定量分析,他又听从了数学老师的建议,改学数学专业。与此同时,他还选修了“国际经济”的课程,这也是他后来对经济领域中的博弈论产生兴趣的原因之一。1948年,纳什以优异的学习成绩,破格同时获得学士和硕士学位,并申请到奖学金,去普林斯顿大学攻读博士学位。
被誉为当代“世界数学中心”的普林斯顿高等研究院就坐落在普林斯顿大学旁,那时里面云集了爱因斯坦、哥德尔、外尔、冯·诺依曼等顶级科学大师;更有陈省身、韦伊、谢瓦莱(Claude Chevalley, 1909-1984)等已崭露头角的数学新杰经常去那里访问和工作。纳什在这如同天堂般的学术环境中,自由自在地大量汲取数学知识。短短数年中,纳什就在代数几何、微分几何和微分方程这三大数学分支领域中分别取得重要的研究成果,早早奠定了他作为一流数学家的地位。特别是他证明了任意的黎曼流形都能嵌入欧几里得空间中,解决了微分几何中一个长期未解决的难题,在数学界引起一片惊叹。
在研究纯数学之余,纳什喜欢思考各种稀奇古怪的问题。例如,他曾发现欧洲有四座城市的位置正好构成一个正方形。纳什对于博弈论更有一种特殊的喜爱,他曾经发明一些棋类博弈,其中有一种在六边形格子的菱形棋盘上进行,其下法类似于围棋,普林斯顿大学的学生们称它为“纳什棋”。
1949—1953年,纳什发表了四篇关于博弈论的简短论文,改变了博弈论的发展方向。其中一篇论文只有一页,共28行,却证明了一个极其重要的定理:
在任何一个多人有限博弈中,至少存在这样一个策略组合,使得对于每位博弈者来说,只要其他博弈者都不改变自己的策略,那么他在该组合中的那个策略就是最优策略。
此定理是冯·诺依曼关于两人博弈“极小化极大原理”的推广,后来被称为“纳什均衡定理”,而定理中所指的那个策略组合被称为“纳什均衡”(Nash equilibrium)。
另一篇论文研究“多人非合作博弈”,即参加者只考虑各自的利益、彼此之间没有任何同盟关系的博弈,这是冯·诺依曼和摩根斯坦的著作所忽略的。纳什运用他的均衡定理证明了这种博弈至少存在一个均衡点,并研究了这些均衡点集合所具有的种种性质。
纳什的另外两篇论文研究“两人合作非零和博弈”,同样获得了冯·诺依曼和摩根斯坦没有涉及的重要结果。
由于泽尔滕(Reinhard Justus Reginald Selten,1930-2016)和海萨尼(John Charles Harsanyi,1920-2000)在20世纪60年代的工作,人们认识到纳什均衡理论的重要性(见以下介绍)。博弈论实验也表明:虽然一两次尝试不一定正好得到纳什均衡点,但经过策略调整的多次尝试一定会收敛于该点。现在,纳什均衡理论已成为广泛研究经济学和社会学问题的有效工具。人们甚至发现,该理论同样可用于研究生物学竞争。
纳什在1950年获博士学位后,于次年受聘到麻省理工学院教数学。1957年,他与出生于萨尔瓦多,毕业于麻省理工学院物理系的艾丽西亚(Alicia Lardé)结婚。1959年,正当妻子怀孕时,纳什因患偏执型精神分裂症而辞职。在以后的二十多年里,他的疾病不时发作。他曾经想建立世界政府,又宣布自己是南极的国王,还要为抵御外星人入侵募集资金。
幸运的是,在家人无限的关爱和照顾下,他的身心后来竟奇迹般逐渐康复,到了20世纪80年代末,他甚至已能够重新开始研究数学。
三
泽尔滕丨图片来源:Andreas Pein
泽尔滕出生于德国的布雷斯劳(弗罗茨瓦夫的旧称,第二次世界大战后归属波兰)。他因有犹太人血统,在第二次世界大战中被迫四处逃难而失学,战争结束后才得以继续念高中。1951-1957年,他在法兰克福大学数学系学习,获得硕士和博士学位,后辗转受聘于多所德国大学,任经济学教授。
泽尔滕的主要贡献在于完善了纳什均衡理论,并率先研究多阶段动态策略作用。1965年,他首先明确指出,纳什均衡可能由于非理性行为而产生于策略树的不可达处,因而不可解。为消除非理性纳什均衡点,他引进了“子博弈完美”(Subgame Perfection)的概念,其要点是排除那些仅仅是口头威胁或讹诈,实际上因代价太大而不可能实施的策略。随后在1975年,他提出了“手颤”(trembling-hand)的概念,即允许博弈者有发生错误的概率。在以上工作的基础上,他成功建立了寡头垄断市场的模型。
四
海萨尼丨图片来源:Chuck Nacke/Alamy
海萨尼出生于匈牙利布达佩斯,中学时代曾获全国数学竞赛第一名。他所就读的路德教会中学是匈牙利最好的学校,也是冯·诺依曼的母校,从这里毕业的学生有数位诺贝尔奖得主。1950年底,海萨尼和女友设法逃往澳大利亚,又辗转到美国,在斯坦福大学师从著名数理经济学家阿罗(Kenneth Joseph Arrow, 1921—2017)攻读经济学博士学位,后长期担任加利福尼亚大学伯克利分校商学院经济学教授,直至1990年退休。
海萨尼的学术成就在于找到了处理非完全信息博弈的方法,从而确保纳什均衡理论能够用于解决大量的实际问题。
在一场博弈中,如果能够了解到所有参加者的全部信息,就被称为“完全信息博弈”,否则就被称为“不完全信息博弈”。纳什均衡理论是建立在完全信息博弈的假设基础上的,在现实中,棋类比赛等体育竞技属于完全信息博弈。但在经济和军事等领域,由于公司和军事部门采取保密措施,因此几乎都是非完全信息博弈,这就限制了纳什均衡理论的应用。
1965—1969年,海萨尼受雇于美国军备控制与裁军署,成为十人博弈论专家小组的成员。博弈论专家们发现,他们无法给美国与苏联的裁军谈判提供有益的建议和帮助,因为这是一场非完全信息博弈:他们不了解苏联真正的军事实力和政治意图。于是,海萨尼试图解决这一难题。他通过假设信息不完全的博弈者有不确定的几种类型,成功把非完全信息博弈转换成完全信息博弈,这样,专家们就能够将纳什均衡理论运用于裁军谈判。
海萨尼的工作使纳什均衡理论有了更广泛的实用性,特别是在经济领域。
五
1994年,正值冯·诺依曼和摩根斯坦的著作发表50周年之际,纳什、泽尔滕和海萨尼因“在非合作博弈均衡理论中的开拓性贡献”而分享了诺贝尔经济学奖。瑞典皇家科学院的梅勒(Karl-Göran Mäler,1939-2020)教授在授奖发言中对纳什说道:“您关于非合作博弈均衡的分析以及其他博弈论研究工作,对于近二十年经济学理论的发展产生了深远的影响。”对泽尔滕说道:“您关于完善博弈的分析大大扩展了非合作博弈理论的应用。”对海萨尼说道:“您关于非完全信息博弈的分析,对信息经济学极为重要。”
作者简介
王善平,1990年华东师范大学数学系现代数学史方向硕士毕业,师从张奠宙。曾任《华东师范大学学报·自然科学版》副主编,《数学与人文》丛书编委。已发表数学史、图书馆学、信息科学技术方面论著30余篇/部。
本文经授权节选自《数理人文 第1辑》(丘成桐主编,中信出版社2024年11月版)中《五位诺贝尔奖数学家》一文,原标题《纳什、泽尔滕与海萨尼:发展多人博弈理论》,图片为编辑所加。
特 别 提 示
来源:返朴