近年来,深度学习在偏微分方程(PDEs)求解中展现出前所未有的潜力。从气象模拟到材料科学,基于数据驱动的神经网络模型正不断重塑科学计算的边界。尤其是神经场(Implicit Neural Representations,INRs),凭借其连续参数化的特性,能够实现跨几何形态的高分辨率建模,在复杂场景下展现出卓越的精度和灵活性。 然而,当面对具有剧烈空间变化的场景时,现有 INR 方法暴露出明显的瓶颈。传统的全局调控机制要求模型在所有空间位置共享同一组调控参数,这种方式在捕捉局部细节特征时显得力不从心。随着场景复杂度的提升,全局调控不仅 限制了模型精度 ,还导致 泛化能力下降 。 为了解决这一难题,清华大学研究团队提出了一种创新的空间调控方法 ——GridMix。灵感来源于谱方法的思想,GridMix 将空间调控参数表示为一组网格基函数的线性组合。GridMix 具备以下特点:摘要:近年来,深度学习在偏微分方程(PDEs)求解中展现出前所未有的潜力。从气象模拟到材料科学,基于数据驱动的神经网络模型正不断重塑科学计算的边界。尤其是神经场(Implicit Neural Representations,INRs),凭借其连续参数化的特性,能够
保留了空间调控的 细粒度局部性 ,确保建模精度;
同时通过共享基函数提取 全局结构信息 ,有效缓解了过拟合风险。
在一系列挑战性的 PDE 建模任务中,GridMix 展现出了显著的性能提升。特别是在稀疏空间域和时间外推场景下,其鲁棒性表现尤为突出。该研究已被 ICLR 2025 接收,并获选为 Oral 论文(入选比例 1.8%)。动态系统建模:旨在捕捉物理系统在预测时间范围内的动态演化过程。具体表现为建模系统从状态
到状态 的转移过程,其中 表示时间步长。几何感知预测:根据系统的几何构型预测其状态。
在几何预测中,每个数据样本分布于不同的空间域,测试时则采用与训练域不同的空间域来评估模型性能。需特别说明的是,和均为完整域 的子集。 基于 INR 的 PDE 建模方法 CORAL 是最具创新性的 INR 方法之一,它通过两阶段训练策略解决偏微分方程建模问题。在第一阶段(重构阶段),该框架采用两个神经调控场和分别对输入和输出函数进行参数化建模。这些神经调控场作为基础模型,通过不同调制参数实现对不同函数的重构。具体而言,INR 参数和在各自函数空间中共享,而调制参数和则是每个函数特有的。这些调制参数通过超网络和从低维调控向量和,。经训练后,每个函数可由低维调控向量经过共享 INR 重构,其重构误差代表了表示质量。在第二阶段(预测阶段),CORAL 通过处理网络学习调控编码与 之间的映射关系。局部细节捕捉 :GridMix 保留了网格调控的局部特性,通过引入额外的可学习参数增强了模型在局部细节重建的表达能力;
全局结构建模 :GridMix 通过共享基函数对调控空间起到正则化作用。相比一般空间调控需要为每个函数额外学习个 独立参数,GridMix 将参数维度降低至基函数的个数。这种维度压缩有效减少了过拟合的风险,提升了模型对全局结构的重建能力,以及在不同空间域上的泛化能力。
实验 动态系统建模 在 Naviers-Stokes 和 Shallow-Water 两个动态系统建模任务上,GridMix 相比神经算子方法(DeepONet 和 FNO)、图网络方法(MP-PDE)以及基于全局调控的 INR 方法(CORAL)均取得了显著的性能提升。同时,GridMix 在 稀疏空间域的重建和时间外推 任务 中表现出优越的鲁棒性,进一步验证了其广泛的适用性。图 5. 稀疏空间域下的 Shallow-Water 可视化结果
几何感知推理
在几何感知推理中,模型根据给定的几何结构(例如翼型(NACA-Euler)、水管(Pipe)和弹性材料(Elasticity))预测系统的状态。 相较于全局调控方法,GridMix 在所有任务中均实现了性能提升。
图 6. 几何感知推理任务
总结 本文的贡献主要在两个方面:来源:科技之光