解放军总医院医学创新研究部刘晓莉实录分享(上):多模态生物医学数据利用

360影视 国产动漫 2025-03-13 16:15 2

摘要:临床医生会综合多源、多模态的数据,进行诊断、预后评估和制定治疗方案。在由解放军总医院举办的第五届“医疗大数据学术交流及 Datathon 活动”会前培训班上,众多专家重点介绍了常用的数据分析工具、方法、数据库以及数据挖掘与分析的基本思路,旨在帮助参会人员掌握数

导读

临床医生会综合多源、多模态的数据,进行诊断、预后评估和制定治疗方案。在由解放军总医院举办的第五届“医疗大数据学术交流及 Datathon 活动”会前培训班上,众多专家重点介绍了常用的数据分析工具、方法、数据库以及数据挖掘与分析的基本思路,旨在帮助参会人员掌握数据科学和 R 语言数据分析的实践技能。

培训期间,刘晓莉博士以《多模态生物医学数据利用与常见开源数据集简介》为题,展望多模态生物医学数据在精准医疗、数字临床实验、传染病预防等领域的发展前景,从研究者视角着重分享了MIMIC 等代表性数据库的使用心得,为更多临床医生及相关领域研究者提供参考。

本篇实录为刘晓莉博士分享上篇,聚焦多模态生物医学数据利用探索如何在临床实践中,应对复杂生物医学数据。

分享嘉宾 刘晓莉

解放军总医院医学创新研究部工程师

毕业于北京航空航天大学生物与医学工程学院,生物医学工程专业博士。读博期间在麻省理工学院计算生理学实验室进行联合培养,研究方向为围绕急危重症救治场景开展健康状态的评估、动态监测和不良事件的早期预警、便捷化辅助决策支持工具研发等。发表学术论文 25 篇,第一作者和共同一作 8 篇,SCl Q1 区文章 10 篇。申请发明专利 9 项,授权 4 项。协助举办”解放军总医院-麻省理工学院医疗大数据研讨会” 4 次。

以下为实录分享内容

Part 1 多模态生物医学数据利用

首要探讨的是多模态生物医学数据的有效利用。众所周知,AI 工具已在众多领域如文本翻译、语音识别和自然图像识别等方面带来了翻天覆地的变化。然而,在医疗领域,其变革的步伐相对稳健。究其原因,主要有两点值得我们深入探究:一是生物医学数据的复杂性和高维性。这种特性导致了许多应用难以推广到不同人群;二是当前的研究与应用往往局限于单一数据模式,仅解决小范围任务,而临床实践中,医生需综合多元、多模态的数据进行诊断、预后评估及治疗规划,这种差异使我们的研究与应用面临重大挑战。

随着生物资料库、电子健康记录、医学成像、可穿戴设备及生物传感器等生物数据的激增,为多模态人工智能解决方案的开发奠定了坚实基础,促使我们更深入地理解人类复杂的健康与疾病状态。在此背景下,我将重点介绍三类关键数据:

第一类是电子健康档案(EHR),EHR 是人们在健康相关活动中直接形成的具有保存备查价值的电子化历史记录。它是存储于计算机系统之中、面向个人提供服务、具有安全保密性能的终身个人健康档案。EHR 以居民个人健康为核心,贯穿整个生命过程,涵盖各种健康相关因素,实现多渠道信息动态收集,以满足居民自我保健、健康管理和健康决策的需要。EHR 通常包含个人信息、医疗记录、疾病史、检查结果、健康评估和健康管理计划、电子签名和授权信息以及其他附加信息。通过 EHR,可以为医务人员和个体提供一个综合的、可靠的健康信息存储和共享平台,以支持个体健康管理和医疗服务的连续性和协调性。

第二类是 Biobank(生物样本库),是一种集中保存各种人类生物材料,用于疾病的临床治疗和生命科学研究的生物应用系统,可标准化地收集、处理、储存和应用健康和疾病生物体的生物大分子、细胞、组织和器官等样本以及与这些生物样本相关的临床、病理、治疗、随访、知情同意等资料及其质量控制、信息管理与应用系统。Biobank 的样本种类繁多,包括但不限于人体器官组织、全血、血浆、血清、生物体液、处理过的生物样本(DNA、RNA、蛋白质等)。可以看到下图左侧展示了目前全球较为知名的 Biobank 的分布情况,右侧则详细列出了这些 Biobank 来源、名字及其体量。

第三类是可穿戴设备采集的生物数据。可穿戴设备是一种在身体上使用的技术形式,包括智能手表、带有传感器的粘性贴片等。这些设备为佩戴者或护理人员提供了多种有用功能,如跟踪身体活动、睡眠,以及提供心率、节律、睡眠情况、血糖水平等生理数据。医疗专业人员越来越多地使用可穿戴设备来收集患者的临床数据。这种数字健康技术(DHT)由患者佩戴,并通过移动应用程序或个人数字助理连接,可用于疾病监测、诊断报警和其他临床护理服务。《新英格兰医学杂志》在去年发表的一篇文章预测,到 2030 年,可穿戴 DHT 的使用将成为主流,并在患者和临床医生的医疗保健、评估和决策中发挥重要作用。下方的图展示了常见的可穿戴设备类型、佩戴部位以及它们可能采集的生理信息,例如在 COVID 期间,通过 Apple Watch 可以连续监测人体的心率、步伐等情况。

下图左侧则展示了通过分析这些可穿戴设备采集的生物数据参数,可以提早一天识别出患者可能发生的 COVID 风险,右侧则列出了一些常见的可穿戴设备类型、名字、厂家以及可以采集的生物参数。

基于当前的多模态数据基础,其未来的应用前景极为广阔,我在这里总结了 6 个类别:

首先是个体化组学数据实现精准医疗,可以把 EHR 影像数据、组学数据的整合,有望进一步加强对人类健康的理解,并实现精准个体化的预防诊断与制定治疗策略,可以通过开发多组学的多模态人工智能工具,实现对个体更深层的表型分析;第二方面是数字临床实验,基于可穿戴技术的数据和智能手机自主问卷,可以用于监测临床试验的患者和识别不良事件,确定试验结果;第三方面是远程监控,达到一个“家中医院”的效果,可以将可穿戴传感器、环境无线传感器与来自 EHR 的数据结合,为患者和护理人员创造更加个体化的远程监控模式;第四方面是传染病监测和防控,可以整合来自轨迹图、手机信号和健康服务数据的多模态数据,以预测疫情传播,并定位密接人群和可能的感染者;第五方面是数字孪生,因为人体的复杂性,需要汇总多组学数据、生理传感器数据、临床信息和社会人口学数据等,利用大数据生成的模型可以准确地预测某种干预对特定患者是否会产生有益或有害的结果;最后一方面是虚拟健康助手,那基于基因组测序、其他组学、持续监测的血液生物标志物和代谢物、生物传感器和其他相关的生物医学数据的个体化配置文件,可以达到改善患者行为、回应健康咨询问题、症状分类或者适时与医护人员沟通。本文内容已做精简,如需获取专家完整版视频实录,可前往和鲸官方公众号领取。

2024 年第五届 Datathon 医疗大数据活动上,和鲸凭借 ModelWhale 数据科学协同平台,为本次活动 236 名选手、23 支队伍提供了全程支持。ModelWhale 成功构建起临床医生、生物统计师与算法工程师等核心科研人员的协同链路:临床医生可聚焦于科研问题挖掘及临床验证;生物统计师专注于研究方案的科学设计与分析方法筛选;算法工程师着力于数据处理、模型搭建与算法落地。借助 ModelWhale 平台,能将三方的研究进程与成果予以有机整合与有效管理,构建起高效协同生态。

您可以前往和鲸官网免费体验探索ModelWhale更多功能

来源:和鲸

相关推荐