摘要:地理空间数字孪生是地理空间信息服务的基础支撑,也是社会智能化建设、规划与发展的重要辅助系统。地理空间数字孪生系统与其他工业数字孪生系统相比,在精确性、系统性和可靠性方面有更特殊的要求。本文提出了地理空间数字孪生系统建设的基本准则,涉及地理实体感知、描述、映射、
本文内容来源于《测绘学报》2024年第2期(审图号 GS京(2025)0242号)
地理空间数字孪生与时空智能
杨元喜1,21.智能空间信息国家级重点实验室,北京 100029
2.
摘要
地理空间数字孪生是地理空间信息服务的基础支撑,也是社会智能化建设、规划与发展的重要辅助系统。地理空间数字孪生系统与其他工业数字孪生系统相比,在精确性、系统性和可靠性方面有更特殊的要求。本文提出了地理空间数字孪生系统建设的基本准则,涉及地理实体感知、描述、映射、统计、预测与动态推演全过程。特别强调,地理空间数字孪生实体感知必须精确、时空基准必须一致、属性描述必须正确、历史信息必须可信、映射关系必须严密、规律统计必须系统、变化预测必须可靠、辅助决策必须科学。粗略划分了地理空间实体感知、映射和动态推演所涉及的研究主题,论述了地理空间数字孪生与时空智能的关系及其地理空间智能研究的主要方向,梳理了地理空间数字智能建设需要解决的关键技术问题,特别指出,需要探讨数据驱动与模型驱动在大模型生成中的贡献率以及历史数据与现实数据在大模型生成中的贡献率优化分配问题。
关键词
数字孪生地理空间信息系统时空智能地理空间实体映射动态推演
杨元喜(1956—),男,博士,研究员,中国科学院院士,研究方向为测绘科学技术。 E-mail:
本文引用格式
杨元喜.
YANG Yuanxi.
阅读全文
1 引言地理空间数字孪生是地理空间实体在虚拟空间中具有位置精确、形状逼真、尺度可伸缩的数字映射。地理空间数字孪生是地理空间信息服务[1]、知识服务的重要方式之一。地理空间数字孪生派生于“数字孪生”概念,数字孪生又称“镜像空间模型”[2],即实体在虚拟空间中的数字映射[3-4]。不同的实体有不同的数字孪生表达方式。数字孪生核心要素包括实体感知(实体观测数据)、物理模型、历史信息、实体关联、虚拟体关联、实体与虚拟体的映射关联[5]等。地理空间数字孪生是数字孪生技术在地理空间实体表达和展示中的具体应用。区别是,地理空间数字孪生包含从地理实体观测到表达,从几何形状到物理属性,从静态到动态的地理空间信息展示甚至推演的全过程。
地理空间实体关系非常复杂,且随时间而变化,通常不能用简单的数字和图形充分表达,于是,地理空间数字孪生及其地理空间数据重构成为研究主题之一[1]。遗憾的是,绝大多数数字孪生系统只重视物理空间的基本形态映射和“展示”,如工业产品的数字孪生往往重视产品的各种形态映射,不太重视产品全生命周期的动态演化[6]。有些环境数字孪生系统重视分析现实自然环境、分析各类自然灾害现状、监测区域经济现状与变化等,并未重视环境实体的时空演化与预测分析。
笔者认为,地理空间数字孪生应该作为地理空间数字智能的底座,通过知识引导、数据驱动、深度学习[7]、支撑服务,实现地理空间数字智能[8-9]。目前,在测绘遥感领域,目标智能解译一直是研究热点[10-12],尤其在遥感大模型研究与关键技术探讨方面已经取得丰富多彩的研究成果,并有大量可应用的遥感大模型[13-15];在实景三维建模方面,利用多层级多视角获取的空间实体细部信息和虚拟空间的映射信息,可以强化实景三维数字孪生建模效能,提升实景三维智能化建模水平[16];在地学智能化研究方面,大数据集的模型训练成为大模型生成的基础,于是监督训练(supervised training)、生成式训练(generative training)、混合训练(hybrid training)等得到学界的广泛关注[17-18]。但是,地理空间智能仍然面临系列挑战[19-20],缺少地理空间数字孪生与地理空间数字智能关系的研究,地理空间大模型生成的机理研究和基础理论研究也相对匮乏。
笔者认为,所有地理空间数字孪生都需要时空标签(时间和空间)、几何形状及属性信息,否则不能实现空间实体信息映射、表达与预测[21],也不可能生成“数字孪生”。从这个意义上说,数字孪生应该包括:感知型[22]、知识型(模型型)[23]、先验型、预测型和反演型(反推型)数字孪生。完整的数字孪生必须从感知、映射、表达、分析到预测和反演,否则就是静态数字映射。
此外,地理空间数字孪生应该侧重利用各类感知信息、物理模型、历史数据进行集成分析,应该重视多物理量、多尺度、多时序地理空间数据的演化分析,即不仅重视真实地理空间实体在虚拟空间中的映射,更应该重视地理空间实体的时间演变推理与动态展示。于是,地理空间数字孪生应该强化空间实体要素的“时空精确性”,为地理空间数字智能分析提供基础。
本文侧重分析地理空间数字孪生的核心要素,分析地理空间数字孪生的主要研究内容,厘清地理空间数字孪生与地理空间数字智能的主要关系,剖析地理空间数字智能涉及的关键技术问题。
2 地理空间数字孪生系统建设的主要内容与基本准则地理空间数字孪生系统建设的主要内容包括地理空间要素表达和地理空间演化推理。其核心是合理、清晰地表达地理空间中的物理要素(地球及空间物理场要素、属性要素、植被要素等)、几何要素(地面和海面结构要素、地面海面和水下地形要素、地下管网要素等)、人文要素(政治、经济、社会、宗教等)和信息要素(信息域、认知域、虚拟空间要素等),并依据地理空间信息随时间和空间的变化及其演变规律分析其变化趋势性。
地理空间数字孪生建设的基本准则如图1所示。
图1图1 地理空间数字孪生准则
Fig. 1 Rules of the geospatial digital twin system
地理空间数字孪生要求所有要素表达必须基于统一的时间基准和空间基准。地理空间数字孪生与其他数字孪生的重要区别在于,时空基准不但要统一,而且要精确。空间建准的一致性是几何变形、位置变化监测的基础,否则数字孪生会出现空间错乱、时间推演混乱。
地理空间数字孪生的几何映射必须精确。数字孪生的逼真性取决于高空间分辨率、高时间分辨率和高精确度的感知数据,包括物理要素和几何要素。为了实现地理空间物理要素和几何要素的高逼真映射,全域感知(包括地基、空基、海基和天基感知)的地理空间几何信息和物理要素信息必须去伪存真,必须精确,否则地理空间数字孪生的逼真性就会受到扭曲。
地理空间数字孪生对地理实体要素描述必须正确。相同形状的要素属性可能存在很大差别,没有正确的属性信息描述,映射的数据尽管可以保证几何相似性,但是不能保证属性演变的真实性。而且基于错误的属性信息不能进行正确的关联分析,更不具备知识挖掘或推演能力。
地理空间数字孪生的关联性表达必须全面可靠。关联关系表达是数字孪生推演的基础,也是地理空间信息知识挖掘的基础。无论地形、山峦、沙漠、河流、道路、管网等都有极强的几何关联性,而地球重力场、地球磁场等物理要素不仅具有极强的物理关联性,而且具有空间和时间连续性,正是这些关联性,支撑了地理空间信息的科学推演与分析。
地理空间数字孪生的历史信息必须可信。地理空间实体的历史数据映射需要可信的时间标签、几何构型和物理属性,否则地理空间实体的动态变化映射即可能出现不连续或异常,于是,地理空间信息的推演需要现势性强的感知数据和可信的历史数据的合理集成与融合。一旦地理空间实体的历史信息出现异常,可以采用抗差Bayes统计法[24]控制历史异常数据对动态变化预测的影响。
地理空间动态变化预测必须严谨。空间实体要素的演进与预测首先取决于历史数据和实时感知数据的系统性和精确性,同样也取决于地理空间数据统计及参数估计方法的严谨性。在严谨的数据统计前提下才能生成可靠的地理空间演变动态模型。为了控制历史异常数据对动态推演结果的影响,可以采用抗差自适应滤波方法[25]。
地理空间辅助决策推演必须科学。只有科学的地理空间信息推演,才能支撑动态变化规律预测,也才能提高辅助决策的科学性和可靠性。
3 地理空间数字孪生系统研究主题分类地理空间数字孪生的研究必须基于地理信息的实体化、语义化、结构化和动态化表达,即用标准化范式对实体空间信息属性要素、物理关联、几何空间关联和时间关联进行一致性描述,以便计算机识别、理解、分析和推演。
地理空间数字孪生“实体化”是指所有地理空间实体要素映射的几何构型、物理属性、物理量值、空间位置、空间范围必须与物理实体对应;地理空间数字孪生“语义化”是指地理空间实体映射的符号化表达,便于在虚拟空间中能够正确识别与表达;地理空间数字孪生的“结构化”是指将地理空间实体进行单体分割,获取其几何形态及组成结构,并进行精细表达;地理空间数字孪生“动态化”是指以地理实体为单元,以时空属性数据为底座,以几何、物理和数值模型为辅助,以空间关联、物理关联和时间关联为纽带,实现对空间实体全要素、全过程数字化映射、模拟及同步交互。
地理空间数字孪生研究主题可以分为5类,如图2所示。
图2图2 地理空间数字孪生分类
Fig. 2 Classification of the geospatial digital twin system
感知型数字孪生强调以实体感知为基础,描述和表达真实的地理空间实体。地理空间感知平台包括天基、空基、舰基、地基及泛在感知[26]。地理空间感知类型包括几何形状、物理属性、地球物理场、空间物理场等。实体感知的精确性支撑地理空间数字孪生的真实性、现势性和可靠性。实体感知的位置精度支撑数字孪生要素的几何关联,实体感知的颗粒度、分辨率和光谱特性支撑数字孪生实体属性分类,实体感知数据的时间精度和分辨率支撑虚拟映射体的时间维推演,实体感知的物理敏感度支撑数字孪生的物理场的变化分析。
知识型地理空间数字孪生强调以知识推理和模型推理为主。模型是基于知识建立的,模型又分为几何模型、物理模型、动力学模型等。空间实体几何模型包括实体的几何构型、空间分布、空间关联等,如数字高程模型、地理信息矢量模型、实体的几何构型模型等;地理空间实体的物理模型包括空间实体物理场表达,如地球重力场模型、磁力场模型、地质构造模型等;空间实体的动力学模型则侧重实体的动态变化描述,如实体运动模型、人文变迁趋势模型、地理演化模型等。知识型地理空间数字孪生支撑地理空间映射的可解释性和推演能力。
先验型地理空间数字孪生重视过往信息统计与关联,是地理空间历史信息的虚拟化表达。地理空间实体历史信息的空间位置、属性、时间变迁等信息都是地理空间数字孪生的重要先验信息,这些地理实体先验信息是描述地形、地貌、物理场空间分布和动态变化推演的重要参考。此外,地理空间先验信息还可以与现实地理信息一起用于数据驱动。如果部分地理空间先验信息可以用精确的模型表达,则可将模型驱动与数据驱动相结合,实现地理空间数字推演。必须注意到,相比于实时感知信息,地理空间实体先验信息的时间和空间基准精度通常较低,且数据分布不均匀,时间标识经常出现混乱,于是,地理空间数字推演必须控制先验信息异常对空间实体演变的影响[25]。
预测型数字孪生实际是数字孪生的正向推演。地理空间数字孪生本身不具备预测能力,只具备基于预测信息的虚拟映射。预测型地理空间数字孪生是基于地理空间实体信息流的时间关联、空间关联和物理关联,并结合现实感知信息预测未来地理空间信息(空间实体)的变化趋势。先验信息在预测型地理空间数字孪生中具有重要作用,先验信息可以用来构建先验时间序列,也可以与现实数据结合形成“先验+现实”集成的地理空间数字映射。动力模型或物理模型是预测型数字孪生的核心支撑。具有物理模型支撑的数字孪生不仅可以增强数字孪生的可预测性,而且可以增强数字孪生结果的可解释性。“物理模型+先验数据驱动+实时观测数据驱动”是预测型地理空间数字孪生的核心手段,数据驱动可以修正物理模型和先验时间序列的系统偏差。于是,预测型地理空间数字孪生的可靠性取决于先验信息和知识模型的可靠性,以及各类地理空间信息的合理利用。
反演型地理空间数字孪生实际是数字孪生的反向推演。利用地理空间现实数据和部分历史信息在虚拟空间中完成对特定历史时段地理空间实体的映射。地理空间信息的时间序列是反推某历史时段空间实体特征的重要依据。“模型驱动+数据反演”是反演型地理空间数字孪生的常用手段,知识模型起着重要作用。于是,反演型地理空间数字孪生的可靠性取决于知识模型和间断地理空间实体先验信息的真实性和可靠性。反演型地理空间数字孪生一般应用于科学研究和历史考证,如特定地区河流变迁、山峦变化、古代城市变迁、居住环境变迁等。
4 地理空间孪生关键技术及其发展方向首先必须强调,地理空间数字孪生不是“地理空间数字智能”,但是,地理空间数字孪生是地理空间数字智能的底座,地理空间数字智能是地理空间数字孪生的发展方向。地理空间智能侧重数据汇聚、分析、统计、聚类,进而生成地理空间规律知识,支撑科学决策。
地理空间数字智能的关联要素包括物联网、云计算、数字化、大数据和机器学习、知识挖掘等理论和方法。物联网和云计算支撑地理空间数字流动、交互、展示到智慧生成,其中物联网提供了各种感知载体和设备的信息感知、数据收集和交换;云边端计算[27]提供强大的计算能力和数据存储服务;数字化过程则提供实体映射、数字孪生表达、动态变化演示;知识挖掘的作用是合理挖掘地理空间要素演化脉络,了解地理空间实体的过去、现在和未来,并生成地理空间数字智能。
地理空间数字智能的特点主要体现在“数据驱动+知识驱动(知识图谱)”“模型预测+数据预测”相结合,实现地理空间数字智能,支撑辅助决策,即实现“灵动的地理空间要素推演及表征”。地理空间数字智能系统构建的基本流程如图3所示。
图3图3 地理空间数字智能生成流程
Fig. 3 Flowchart of the establishment of geospatial digital intelligence
从地理空间知识生成的基本流程可以看出,“知识模型”与“机器学习”相结合是提取地理空间实体的演变特征和规律的重要途径,地理空间时空大模型是地理空间智能发展的主要方向[13-15]。其中机器学习侧重让计算机模拟大脑神经网络在地理空间实体数据集中进行模式识别和特征提取,尤其是识别提取与地理空间要素有关的地形、地貌、植被的变化特征,分析或模拟关联关系,挖掘知识,建立新的模型,实现辅助决策和行为策略优化。地理空间智能在抢险救灾、灾害监测与预警等方面已经发挥了重要作用,在城市建设与规划等辅助决策方面也有重要应用前景。
地理空间数字智能系统建设的重点研究方向包括但不限于以下6个主要方面。
(1)地理空间数字要素的时空标签归一化问题。首先,地理空间数字孪生和数字智能必须基于相同的时间基准。多实体映射的时间分辨率越高,实体动态演化规律提炼就越精确。于是,具有精确时间标签的地理实体数据驱动才能精确体现虚拟体的时间演化,进而实现空间实体与数字空间虚拟体的双向映射,实现感知数据与实体模型、关联模型的交互,才能可靠挖掘地理空间关联演化的规律。其次,地理空间实体映射必须基于统一的空间基准。因为空间关联体现的就是位置关系及其变化,这也是决策支持的核心内容之一。不在同一空间基准下的实体映射易导致空间位置混乱,不仅影响空间实体的位置精确性,而且影响多实体的空间关联分析和演化分析。
(2)机器学习和大模型生成的目标函数构建。地理空间数据的机器学习和大模型生成都需要实现特定的目标,基于不同目标函数的机器学习将生成不同的大模型,同样也生成不同的地理空间数字智能。于是,如何依据实际需求建立合理的目标函数也是地理空间数字智能需要解决的关键问题之一。目标函数包括动态目标函数和附有约束的目标函数等。
(3)特定的地理空间知识模型(包括几何模型和物理模型)与大模型的合理融合是可解释大模型建立的基础。地理空间现有的数学模型有时比大模型具有更可靠的推演能力和背景解释能力。所以,基于几何模型约束或物理模型支撑的机器学习可望生成更科学的地理空间大模型。这也是地理空间数字智能强化学习的重要基础。
(4)地理空间实体时间演变机理研究。地理空间数字智能首先要解决地理空间要素的相互关联作用及其表征,探索地理空间实体要素动态演变催动机理、地理空间实体要素变迁与人文要素和环境要素影响机理。地理空间实体演变机理是地理时空大数据知识挖掘,预测、解释的核心支撑。目前正在兴起的DeepSeek-R1的知识蒸馏和知识推理也是地理空间知识提取的重要途径[28]。
(5)地理空间知识自主探索和发现研究。生成地理空间数字模型需要解决规律知识的挖掘与提炼,尤其要深入探讨在无标签的海量数据中进行自动聚类、降维、关联分析等(即所谓的无监督学习)[29-30],也需要探讨依据标签数据指导的海量数据自学习和规律分析(有监督学习),更需要探讨依据自学习、自反馈的弱监督学习方法[31],进而实现在纷杂的地理空间数据中的知识分类、模型降维和数据规律探索等。
(6)地理空间不同历史时期信息与实时感知信息在机器学习和大模型构建中的贡献率分配策略研究。在构建机器学习的目标函数时,还必须解决历史信息与实时感知信息贡献分解以及模型驱动与数据驱动的贡献分解,必须剖析数据演化对知识模型修正的反馈机理(即生成式大模型)等。
5 结束语地理空间“时空大数据+数字映射”支撑地理空间数字孪生。地理空间数字孪生要求实体感知精确、要素描述正确、关联映射全面、规律统计可信、变化预测严谨、决策推演科学。
“地理空间数字孪生+模型驱动+机器学习”是地理空间数字智能生成的基本途径。
必须强调指出的是,地理空间数字孪生不等于地理空间数字智能。前者只具备实体空间要素到虚拟空间的关联映射和展示,后者侧重地理空间要素关联关系学习、样本训练、知识挖掘、动态推演和辅助决策。地理空间数字智能建设的核心是挖掘地理空间大数据的规律,生成地理空间数字智能,支撑地理实体变化预测、反演和辅助决策能力生成。
物联网、数字化、网络化、大数据、机器学习、云计算、大算力等支撑地理空间数字智能的智慧生成。需要探讨适应地理空间实体的泛在感知数据接入、融合与映射,探讨各类地理空间知识挖掘与智慧生成的机理、理论与方法,探讨地理空间数字智能生成的各类目标函数,探讨大数据、大模型、知识库的互动关联模式。
最后强调,精确的地理空间要素的几何模型、物理模型与基于大数据和机器学习的大模型相得益彰,基于地理空间实体的几何模型和物理模型约束下的机器学习方法值得系统研究与探索。
来源:测绘学报