摘要:进化是生物种群对其生存环境进行最优适应的过程,这一过程通过“适应度”得以体现。适应度被定义为相对的繁殖成功率(reproductive success)。然而,有学者指出,这一定义并不完整,且逻辑上存在循环论证的问题。为解决这一问题,多位研究者呼吁以表型(ph
摘要
进化是生物种群对其生存环境进行最优适应的过程,这一过程通过“适应度”得以体现。适应度被定义为相对的繁殖成功率(reproductive success)。然而,有学者指出,这一定义并不完整,且逻辑上存在循环论证的问题。为解决这一问题,多位研究者呼吁以表型(phenotypes)与环境之间的关系为基础,重新明确界定适应度。本文提出,将适应度定义为从种群动态映射到贝叶斯学习的似然函数,为这一问题提供了一个通用解决方案。我们展示了如何通过这种方式构建适应度的概率模型,并说明其平均值如何具有意义。此外,我们还展示了这一方法如何为分析多变环境中的进化难题、博弈论以及群体结构中的选择问题提供强大工具。这一方法具有普适性,并在种群动态、统计学习理论以及新兴的人工智能模型之间架起了一座明确的桥梁。
研究领域: 适应度,贝叶斯学习,进化博弈论,群体结构选择(group-structured selection)、互信息,信息最大化图 1. 不同环境下种群选择的进化动态机制。A. 作为适应模型的适应度与给定表型的环境状态的可能性成正比。B. 随着时间的推移,迭代过程对环境统计进行平均,并选择使平均对数适应度最大化的种群类型作为种群结构与环境之间的信息。
研究进一步证明,自然选择的目标是最大化种群结构与环境之间的互信息。在长期演化中,表型的平均对数适应度 (log-fitness) 趋近于环境熵与模型预测误差的差值。当表型的条件概率(p(e|s))与环境真实分布(p(e))一致时,互信息达到峰值,此时种群成为环境的“最优编码器”。 例如,在任务切换 (task switching) 模型中,种群需在两种环境状态(e=0/1)下分配资源。贝叶斯动态驱使表型频率最终与环境概率分布重合,使种群信息与环境熵相等,实现预测误差的最小化。基于贝叶斯适应度框架,团队重新审视了囚徒困境 (prisoner's dilemma) 等经典博弈问题。在这个问题下,两个参与者在追求各自利益最大化时,可能因为不信任和背叛而陷入对双方都不利的局面,尽管选择合作可以带来更好的结果。传统模型中,背叛 (defection) 是单次博弈的纳什均衡,但重复博弈可能催生合作。新模型揭示了更深刻的统计机制:
1. 完全混合种群 中,合作稳定的条件可表述为汉密尔顿法则 (Hamilton's rule) 的扩展形式:当协同效应与互惠概率满足一定条件时,合作策略将突破适应度谷底,引发一级相变。
2. 群体结构 通过调节内外群互动改变选择压力。若群体内互惠足够强,即使存在外部群体剥削,合作仍可通过信息边界的建立而稳定 (图3) 。 研究还发现,混合环境 (如交替出现竞争与合作博弈) 会改变相变临界点,为现实中的策略多样性提供了新解释。图 3. 结构种群的选择取决于群体的大小和对外群体的处理。
在结构化种群中,个体的适应度受群内与群间互动的双重影响。模型显示:
群内协同 :当群体标识可识别时,个体通过条件策略 (如“内群合作/外群背叛”) 实现局部信息优化,形成多层级的适应度景观。
群间竞争 :群体规模的异质性导致选择压力分化,大群体更易维持合作,而小群体可能沦为“信息孤岛”。 这种动态解释了为何血缘关系或文化标签常成为群体合作的催化剂,它们实质上是降低环境不确定性的信息标记。 这项研究将自然选择转化为统计学习的一般原理。适应度作为似然函数的定义,不仅为进化模型提供了可计算的概率框架,还与机器学习中的生成模型 (generative model) 形成镜像。例如,种群对环境的渐进优化,与神经网络通过梯度下降逼近数据分布的过程具有数学同构性。 未来,这一理论有望推动跨学科应用:从设计环境适应的基因回路,到优化多智能体协同算法,甚至在元宇宙生态中模拟复杂社会演化。正如作者所言:“生命与机器学习共享同一套数学语法——通过信息最大化,在不确定性中捕捉秩序。”生命复杂性读书会:
生命复杂系统的构成原理
在生物学中心法则的起点,基因作为生命复杂系统的遗传信息载体,在生命周期内稳定存在;而位于中心法则末端的蛋白质,其组织构成和时空变化的复杂性呈指数式增长。随着分子生物学数十年来的突飞猛进,尤其是生命组学(基因组学、转录组学、蛋白质组学和代谢组学等的集合)等领域的日新月异,当代生命科学临近爆发的边缘。如此海量的数据如何帮助我们揭示宇宙中最复杂的物质系统——“人体”的构成原理和设计原理?阐释人类发育、衰老和重大疾病的发生机制?
集智俱乐部联合西湖大学理学院及交叉科学中心讲席教授汤雷翰,国家蛋白质科学 中心(北京)副研究员常乘、李杨,香港浸会大学助理教授唐乾元,北京大学前沿交叉学科研究院研究员林一瀚,中国科学院分子细胞科学卓越创新中心博士后唐诗婕,共同发起 「生命复杂性:生命复杂系统的构成原理」读书会 ,从微观细胞尺度、介观组织器官尺度到宏观人体尺度,梳理生命科学领域中的重要问题及重要数据,由生物学家提问,希望促进统计物理、机器学习方法研究者和生命科学研究者之间的深度交流,建立跨学科合作关系,激发新的研究思路和合作项目。读书会目前共进行10期,现在报名参与读书会可以加入读书会社群,观看视频回放,解锁完整读书会权限。
来源:晚晚的星河日记一点号