摘要:Sakana AI联合MIT、OpenAI等机构提出了全新算法,自动搜索人工生命再达新的里程碑!不需要繁琐手工设计,只通过描述,AI就能发现全新的人造生命体了。
【新智元导读】 Sakana AI联合MIT、OpenAI等机构提出了全新算法,自动搜索人工生命再达新的里程碑!不需要繁琐手工设计,只通过描述,AI就能发现全新的人造生命体了。
就在刚刚,由Transformer八子创立的Sakana AI,联合来自MIT、OpenAI、瑞士AI实验室IDSIA等机构的研究人员,提出了「自动搜索人工生命」的新算法!AI自动搜索「可能的生命」
生命是什么? 这个看似简单的问题,却蕴含着无尽的探索空间。 现实世界中,我们只能去观察和研究已知的生命形式。但是,通过计算机模拟,科学家们正在探索一个更宏大命题——可能存在的生命。 这也是人工生命(ALife)研究的核心。 通过计算机来研究生命,便意味着需要搜索、绘制整个可能的模拟空间,而非是单一的模拟。 它能够让研究人员弄清,为什么以及如何通过不同模拟配置,会产生不同涌现的行为。 ALife在模拟中进化和学习机制丰富多样,但其基础性突破一个主要障碍是缺乏系统性方法来搜索所有可能的模拟配置。 传统上,研究人员主要依靠直觉和经验,去设计猜测这些「人工虚拟世界」的基本规则。 另一个挑战便是,在复杂系统中,简单部件大规模相互作用,可能会产生完全意想不到的涌现结果。 最最重要的是,这些现象很难,甚至不可能提前预测。 这种不可预测性使得设计出,能自我复制、生态系统动态等特性的模拟变得极其困难。 也正因此,当前ALife领域的研究往往通过手动设计模拟,而且这些模拟也仅针对简单、可预测的结果,从而限制了意外发现的可能性。 那么,什么才是最好的解决办法? Sakana AI、MIT、OpenAI等人认为,自动化搜索模拟的方法,能够扩大探索范围,从根本上改变ALife研究方式。 当前,也有很多团队尝试通过复杂生命度量、复杂性、有趣程度去量化ALife,但这些指标几乎总是无法完全捕捉人类对这些概念的细微理解。ASAL开创性框架
对此,新研究中提出了一个创新方案:利用基础模型(FM)来自动化搜索合适的模拟。 基础模型们基于大量自然界数据完成训练,形成了与人类形式的表征能力,甚至可能正在趋向于真实世界统计特征的「柏拉图式」表征。 正是这一特性,使得FM成为量化人工生命复杂性的理想工具。 基于这个思路,团队提出了自动化人工生命搜索(ASAL)全新框架,如下图所示。 研究人员首先定义一组感兴趣的模拟,称为「基质」(substrate)。 基质S包含任何感兴趣的人工生命模拟集合(例如所有Lenia模拟的集合)。这些模拟可能在初始状态、转换规则或两者都有所不同。 S由参数θ定义,该参数确定了一个包含三个组件的单一模拟: - 渲染函数(将状态转换为图像)Render_θ 这里,需要说明的是,渲染函数的参数化和搜索并非是必要的,但在处理先验不可解释的状态值时,才是必要的。 将这些项连接在一起,定义一个函数θ,它对初始状态 S_0 进行采样,运行模拟T步,并将最终状态渲染为图像:监督目标搜索
——针对能够产生特定目标事件或事件序列的模拟进行搜索,从而促进各种可能世界或与我们自身相似世界的发现。 在ALife研究中,寻找能够实现特定事件或事件序列的模拟是一个重要目标。 这种发现可以帮助研究人员识别,与人类世界相似的模拟世界,或者测试某些反事实的进化轨迹在给定基底中是否可能,从而洞察某些生命形式的可行性。 为此,ASAL系统搜索能够产生与目标自然语言提示在基础模型表示空间中匹配的图像的模拟。 研究人员可以控制在每个时间步是否使用提示,以及使用什么样的提示。开放式搜索
——针对能够在基础模型(FM)表示空间中产生时间上持续开放的新奇性的模拟进行搜索,从而发现对人类观察者始终有趣的世界。 ALife研究的一个重大挑战是寻找开放式模拟。 尽管开放性是主观的,且难以定义,但在适当表示空间中的新颖性可以捕捉到开放性的一般概念。 这种方法将测量开放性的主观性转移到表示函数的构建上,该函数体现了观察者的视角。 论文中,视觉-语言基础模型的表示作为人类表示的智能体。 有了这种新的能力,ASAL可以搜索能够在基础模型表示空间中产生历史性新颖图像的模拟。 一些初步实验表明,通过历史最近邻来评估新颖性,比基于方差的方法效果明显更好。启迪式搜索(Illumination)
——针对一组具有趣味性和多样性的模拟进行搜索,从而探索未知的世界此外,ALife研究的另一个关键目标,是自动揭示基质中可能出现的所有多样化现象。 这种理念,是源于对理解「可能存在的生命形式」的追求。这种揭示是绘制和分类整个基底的第一步。 为了实现这一目标,ASAL搜索一组模拟,使其产生的图像在基础模型的表示空间中,最近邻距离最大。 研究人员发现,这种基于最近邻的多样性比基于方差的多样性能够产生更好的揭示效果。 总的来说,ASAL全新方法已经在多个人工生命系统中取得重要突破,包括Boids、粒子生命、生命游戏、Lenia和神经元元胞自动机等等。 ASAL发现了前所未见的生命形式,拓展了人工生命中涌现的结构边界。 而且,这也是人类首次通过基础模型驱动ALife模拟发现的研究。
实验
研究者通过多种基质的实验验证了ASAL的有效性,随后利用基础模型(FM)对部分发现的模拟,进行了新颖的定量分析。基础模型
- CLIP(对比语言-图像预训练) 这是一种视觉-语言基础模型,通过在大规模互联网数据集上进行对比预训练,将图像和文本的潜在空间对齐,从而学习通用的图像和文本表示。 CLIP明确提供了 VLM_img(⋅) 和 VLM_txt(⋅) 两种功能。 - DINOv2(无标签蒸馏) 这是一种仅针对视觉的基础模型,通过在大型图像数据集上使用自监督的师生框架学习视觉表征。 DINOv2仅提供VLM_img(⋅),因此无法用于ASAL的监督目标搜索。基质
- Boids 它模拟了N个「鸟群」(boids)在二维欧几里得空间中的运动。 所有boids共享一个神经网络的权重,该神经网络根据局部参考框架中K个邻近boids的情况,决定每个boid向左或向右转向。 该基质是神经网络的权重空间。目标模拟的搜索
- 单一目标
团队研究了在Lenia、Boids和Particle Life中,通过单个提示词指定目标模拟的搜索效果。 监督目标方程在经过T个模拟时间步后,应用一次提示词进行优化。其中,CLIP作为基础模型,优化算法使用了Sep-CMA-ES。 下图显示,从定性角度看,在找到与指定提示词匹配的模拟方面,优化过程的表现良好。 一些失败模式表明,当优化失败时,问题往往出在基质的表达能力不足,而非优化过程本身。- 时间序列目标
团队研究了使用NCA基质搜索,生成一系列目标事件的模拟的有效性。 通过一个提示词列表,研究者优化了监督目标方程,每个提示词在模拟展开过程中按均匀的时间间隔依次应用。 研究者使用CLIP作为基础模型。按照原始NCA论文的方法,使用了时间反向传播和梯度下降算法,并采用Adam优化器进行优化。 下图展示了ASAL可以找到生成符合提示词序列轨迹的模拟。 通过指定期望的进化轨迹并结合约束基质,ASAL能够识别出体现所需进化过程本质的更新规则。 例如,当提示词序列为「一个细胞」然后是「两个细胞」时,相应的更新规则会自然地支持自我复制的能力。搜索开放式模拟
为了研究搜索开放式模拟的有效性,研究者使用了类生命元胞自动机(Life-Like CAs)基质,并优化了开放式评分。 CLIP作为基础模型。由于搜索空间相对较小,仅包含262,144种模拟,因此采用了穷举搜索方法。 下图揭示了类生命元胞自动机中开放式的潜力。 根据开放式指标,著名的康威生命游戏(Conway’s Game of Life)在开放式评分中排名前5%。 顶部子图显示,最开放的元胞自动机表现出位于混沌边缘的非平凡动态模式,因为它们既不会停滞,也不会爆炸。 左下方子图描绘了三个元胞自动机在CLIP空间中的轨迹随模拟时间的变化情况。 基础模型的表示与人类的认知表示相关,通过基础模型表示空间中的轨迹生成新颖性,也会为人类观察者带来一系列新奇体验。 右下方子图使用UMAP图对所有类生命元胞自动机的CLIP嵌入进行了可视化,并按开放式评分着色,显示出有意义的结构:最开放的元胞自动机集中在模拟主岛外的小岛上。展示了发现的元胞自动机在模拟展开过程中的渲染结果
描绘了三个模拟在CLIP空间中的时间轨迹。像素空间模拟(红色)表现出收敛轨迹,而基础模型空间模拟(绿色)表现出更具发散性的轨迹,甚至超过了康威生命游戏(蓝色)的轨迹
所有类生命元胞自动机基于其最终状态的CLIP嵌入的UMAP投影绘制,并按开放式评分着色。结果揭示了类似模拟的独特岛屿结构,其中最开放的元胞自动机集中在底部附近的小岛上启迪整片基质(Illuminating Entire Substrates)
研究者使用Lenia和Boids基质,来研究启迪式算法的有效性,其中CLIP作为基础模型。 他们使用一种自定义的遗传算法执行搜索:在每一代中,随机选择父代,生成带有变异的子代,然后保留解决方案中最具多样性的子集。 结果模拟集被展示在下图的「模拟图谱」中。这种可视化突出了按视觉相似性组织的发现行为的多样性。 可以看到图谱以一种有序的方式映射了所有发现的模拟。其中,左上方的插图显示了未使用启迪式算法进行随机采样的结果。 在Lenia中,ASAL发现了许多以前未曾见过的生命形式,这些生命形式类似于按颜色和形状分类的细胞和细菌。量化人工生命
基础模型(FM)不仅可以对有趣现象进行搜索,还能够对之前仅能进行定性分析的现象进行定量化分析。 在下图中,研究人员对两个Boids模拟之间的参数进行线性插值。中间的模拟缺乏任何一个原始模拟的特性,表现为无序状态,这清楚地表明Boids参数空间具有非线性和混沌特性。 更重要的是,通过测量中间模拟最终状态与两个原始模拟的CLIP相似性,这一定性观察现在可以通过定量数据得以支持。独立于基础模型
为了研究使用适当表示空间的重要性,研究人员对Lenia和Boids的启迪式过程所使用的FM进行了消融实验。 在实验中,他们分别使用了CLIP、DINOv2以及低级像素表示作为对比。 如下图所示,在生成与人类认知一致的多样性方面,CLIP的表现似乎略优于DINOv2,但两者在质量上都显著优于基于像素的表示。 这一结果强调了在衡量人类对多样性概念的认知时,深度基础模型表示(如CLIP和DINOv2)相比低级指标(如像素表示)的重要性。来源:东窗史谈一点号
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!