摘要:准确的诊断在医疗保健中至关重要,它是获得恰当且及时治疗的关键所在。近期,以 ChatGPT 为代表的大语言模型(large language model,LLM) 在少样本或零样本学习方面展现出了令人瞩目的能力,然而,它们在临床诊断中的有效性,仍未得到证实。
撰文丨王聪
编辑丨王多鱼
题图为王光宇研究员
准确的诊断在医疗保健中至关重要,它是获得恰当且及时治疗的关键所在。近期,以 ChatGPT 为代表的大语言模型(large language model,LLM) 在少样本或零样本学习方面展现出了令人瞩目的能力,然而,它们在临床诊断中的有效性,仍未得到证实。
2025年1月8日,北京邮电大学王光宇研究员联合北京大学第三医院宋纯理教授、宜昌市中心人民医院/三峡大学第一临床医学院杨简教授,在Nature Medicine期刊发表了题为: A generalist medical language model for disease diagnosis assistance 的研究论文 【1】 。
该研究开发了一种用于疾病诊断辅助的通用大语言模型——MedFound。
在这项最新研究中,王光宇团队推出了一款名为MedFound的大语言模型,这是一款拥有1760 亿参数的通用医学语言模型,其在来自不同医学文本和真实世界临床记录的大规模语料库上进行了预训练。研究团队进一步对 MedFound 进行了微调,采用基于自引导策略的链式思维方法来学习医生的推理诊断,并引入了一个统一的偏好对齐框架,使其与标准临床实践保持一致。
广泛的实验表明,在八个医学专科领域内,该医学大语言模型在分布内(常见疾病)、分布外(外部验证)和长尾分布(罕见疾病)场景中优于其他基准大语言模型和专业模型。进一步的消融研究表明,该医学大语言模型训练方法中关键组件的有效性。
研究团队对大型语言模型(LLM)诊断的临床适用性进行了全面评估,包括人工智能(AI)与医生的比较、人工智能辅助研究和人工评估框架。
该研究提出的框架纳入了八项临床评估指标,涵盖了诸如病历总结、诊断推理和风险管理等能力。总的来说,这性 研究结果表明,MedFound模型在临床工作流程中辅助医生进行疾病诊断方面是可行的。
诊断通用系统的开发与评估示意图
MedFound模型诊断案例:
对于上述病情描述,医生诊断为急性支气管炎,而MedFound模型诊断为慢性支气管炎急性加重,医生将诊断结果修正为慢性支气管炎急性加重。
对于上述病情描述,医生诊断为亚临床甲状腺功能减退,而MedFound模型诊断为自身免疫性甲状腺疾病,医生将诊断结果修正为自身免疫性甲状腺炎。
王光宇研究员
王光宇博士,北京邮电大学研究员,曾获2022年科学探索奖。王光宇研究员长期致力探索智能医学生物计算新理论方法及关键技术,并取得了一系列国际前沿水平的研究成果。
2020年4月,王光宇等人在国际顶尖学术期刊Cell发表论文 【2】 ,该研究利用CT数据开发了一款人工智能(AI)系统,可用于诊断新冠肺炎,还能够将其与其他常见肺炎和正常对照区分开来,从而协助放射科医生和内科医生进行快速诊断,帮助临床医生对抗COVID-19。
2023年7月,王光宇等人在国际顶尖医学期刊Nature Medicine发表论文 【3】 。该研究开发了一款人工智能(AI)预测系统——UniBind,该系统能预测 SARS-CoV-2 中有哪些突变株将对人类构成重大威胁,有助改变人们分析 COVID-19 以及潜在的其他传染病的模式和能力。
2023年9月14日,复旦大学附属中山医院李小英、陈颖团队联合北京邮电大学王光宇团队,在国际顶尖医学期刊Nature Medicine上发表了题为:Optimized glycemic control of type 2 diabetes with reinforcement learning: a proof-of-concept trial 的研究论文 【4】 。
研究团队采用强化学习算法构建了2 型糖尿病的胰岛素决策模型;并从计算机模拟效果、专家评估、真实世界患者疗效评估,证实了该模型可制定个体化、精准、动态的胰岛素治疗方案,或将作为潜在的有效工具辅助临床医生管理 2 型糖尿病患者,减轻医疗负担,助力分级诊疗,赋能慢病管理。
论文链接:
1. https://www.nature.com/articles/s41591-024-03416-6
2. https://www.cell.com/cell/fulltext/S0092-8674(20)30551-1
3. https://www.nature.com/articles/s41591-023-02483-5
4. https://www.nature.com/articles/s41591-023-02552-9
来源:小何说科学