摘要:他在微软任职期间参与了一项影响深远的研究,使用人工智能技术分析电子健康记录,以降低医院再入院率。但即使在OpenAI的ChatGPT、Anthropic的Claude 和谷歌的Gemini等系统都取得了巨大进步之后,他当初的这个预测仍未实现。
“数学可以产生实际影响的想法让我着迷。”
大约15年前,当Mohsen Bayati作为微软的博士后研究员开始在医疗行业从事机器学习研究时,他确信人工智能系统在5年内就会在医疗领域得到普及。
他在微软任职期间参与了一项影响深远的研究,使用人工智能技术分析电子健康记录,以降低医院再入院率。但即使在OpenAI的ChatGPT、Anthropic的Claude 和谷歌的Gemini等系统都取得了巨大进步之后,他当初的这个预测仍未实现。
“我感到很沮丧,为什么这项技术的普及如此缓慢?” 斯坦福商学院The Carl and Marilynn Thoma运营、信息与技术学教授Mohsen Bayati说道,“但这些年来,我逐渐认识到,这不仅仅是一个技术问题。”
医疗保健确实是一个很复杂的行业,有许多相互冲突的利益诉求,包括患者健康、医疗成本以及法律和监管要求等等。但Bayati发现,这其实是一个更基本的关于“人”的问题。
“人工智能解决方案缺少的一个关键因素就是临床医生不信任它们。” 他说,“即使一个系统可以做出最好的预测,但只要它做出了一次非常离谱的预测—一个完全捏造的、在该领域被称为‘幻觉’的结果—人们就会完全失去信任。”
近年来,Bayati开始着手解决这个问题,希望可以在人与日益成为我们生活一部分的机器之间建立起信任。目前他已经有两项研究取得了进展,包括减少药房用药说明中的错误和预测前列腺癌复发概率。这些研究是一系列研究工作的其中一部分,旨在利用数据驱动的学习、决策模型以及数学和统计物理理论(研究原子和其他粒子的行为)来改善医疗保健和实验设计。
Bayati的研究改变了医疗保健的实践和结果:他在网上药店药物使用说明错误方面的研究使所谓的险情事件—即在错误到达患者之前就被发现—减少了33%;而他对再入院率的研究预测再入院率将降低18%。
“在学术界,你的研究成果能够直接对实践产生影响的情况并不常见。” Bayati说道,“当这种情况发生时,我真的感觉很神奇。”
但所有这些影响差点就没能发生。
Bayati于2000年来到斯坦福大学攻读数学博士学位。此前,他一直在伊朗学习数学专业,主要研究多维曲面的拓扑结构。
“我所研究的数学类型与你能想到的应用数学相去甚远—完全抽象,在双曲世界中运作,那里的距离概念与我们的世界不同。” 他笑着说。
这项工作很有趣,但Bayati发现自己对工程系的朋友们所做的研究更感兴趣。“他们也在研究数学问题,不过是在应用方面。” 他解释道,“数学可以产生实际影响的想法让我着迷。”
因此,Bayati转到了电气工程系攻读该领域的博士学位,在此期间还曾到微软研究院理论组实习。在那里,商业研究人员的工作及其影响潜力令他大开眼界。2007年,他以博士后研究员的身份重返微软,在一个由计算机科学理论家和数学家组成的团队中工作了两年。他有机会第一次了解到了机器学习及其预测能力—当你“掌握了某个事件的一些历史数据,并想预测该事件的未来发生情况时” 。他的团队联系了华盛顿特区的一家医院,询问他们有什么问题想要预测,关于再入院率的研究就是从那次合作中诞生的。
Bayati所学的技能在许多其他领域都很有用—例如,在线广告也依赖于机器学习的预测—虽然在技术领域“已经开始运用更为复杂的解决方案”,但在医疗保健领域, “你会立即注意到方法上的差距”。这种差距对Bayati而言很有吸引力,因为它为他提供了发展的空间。
“你也可以称之为套利机会。” 他承认,“如果你能将更复杂的解决方案应用于医疗保健,你就可能会产生更大的影响。”
以人为本的人工智能
在过去几年里,除了在斯坦福大学电气工程和放射肿瘤学系任教和提供咨询之外,Bayati还是一名亚马逊学者,为该公司的科学家提供咨询和合作。
在此期间,他参与开发了一个名为MEDIC的结合语言模型的系统,可以提供剂量和频率等用药指导。该系统是基于药剂师等专家的指导,因此被称为人机协同的AI解决方案。与更传统的药剂专家不参与训练过程的大语言模型相比,MEDIC会更准确。而且,它还具有由人工输入构建的内置护栏,旨在防止其越界运行。
Bayati选择学术界而非工业界的原因之一是,教授的工作职位可以赋予他探索复杂而持久的问题的“自由” 。
Bayati和他的同事们还将MEDIC系统与当时最新版本的ChatGPT、Claude和 Gemini一起进行了测试。那些AI系统和基准LLM在某些时候会将药片或胶囊搞混。它们甚至会错误地添加、曲解或是完全捏造用药指示。正是这种“幻觉”动摇了人们对人工智能技术的信心。除了相比之下更可靠以外,MEDIC还更迅速、更便宜,所需的计算能力也要少得多。
“在现实环境中实施诸如MEDIC之类的人工智能解决方案,尤其是涉及人机交互的情况下,还面临着很多挑战。” 作者在发表于《自然医学》杂志的论文《用于预防网上药店药物使用说明错误的大语言模型》中写道,“它需要一段较长的评估和优化时间,而且需要与数据录入的技术人员和药剂师密切合作。建立起对人工智能生成的建议的信任并纳入持续的反馈至关重要。”
在其他正在进行的研究工作中,Bayati还提升了人们创建更准确、更可靠的人工智能系统的能力。他与斯坦福大学的医生合作,利用患者临床数据建立了一个可以预测前列腺癌复发概率的人工智能系统。该团队使用147名患者作为样本,通过审查医生包括活检报告和临床记录在内的病情进展记录,创建了一个机器学习结果预测模型。与更传统的机器学习模型相比,该团队的模型能够从病情进展记录中“提取更多信号”,并最终更准确地预测复发概率。
由于该模型需要耗费大量时间手动审查临床医生的记录,“在实践中不太可能使用”,Bayati承认。尽管如此,该研究“基本上为人工智能在医疗保健领域的应用指明了方向” 。“这是我们应该可以做到的。” 他说,“我们应该改进我们的人工智能,来实现这一点。”
改进实验
Bayati最近的研究重点并不是预测问题,而是如何设计更好的实验来测试医学和其他领域的干预措施。论文《未知和一般网络干扰实验的因果消息传递》的灵感就来自于Bayati在攻读博士学位期间学到的一项统计物理技术。这项工作试图解决实验中的干扰问题。例如,假设你正在某个城市测试一项疫情预防政策,并将其效果与附近城市的现行政策进行比较。来自不同城市的人们可能会相互交流,比如通勤到其他地方工作或往返拜访朋友或家人。因此,如果一个城市的“病情变得更严重” ,那么另一个城市的病情也可能会变得更严重。各实验组之间的相互作用会扭曲实验结果。Bayati与该论文第一作者、博士生Sadegh Shirani共同完成的这项研究,为一种他们称之为因果信息传递的技术提供了概念验证,该技术可以在存在网络干扰的情况下估计总体治疗效果。
“我们正处于研发阶段,” Bayati说,“但前景非常光明。”
Shirani表示,这项研究意义重大,因为它连接了两个领域:统计物理学和因果推理。“可以利用物理学中的现实直觉来解决完全不同领域的问题,这非常令人兴奋。” 他解释道。
他最近的另一项研究是“交错部署的最佳实验设计”,试图解决受控实验中的另一个问题。想象一下,为了降低干扰风险,你决定将每个大都市区划分为一个实验组。比如,整个旧金山湾区作为一组,整个纽约地区作为另一组,而不是以单个城市或县来划分。这样做可以使干扰的可能性降低,但实验的样本量也会降低—全国的大都市区数量比城市和县要少很多。
Bayati和斯坦福商学院的其他同事,包括Susan Athey和Guido Imbens,以及论文的主要作者、当时还是博士生的Ruoxuan Xiong一起,尝试通过使用交错部署的方案来解决这一问题。
“这篇论文运用了时间元素。” Bayati解释道,“我们可以通过观察每个样本在一段时间内的变化来生成更多信息。论文的重点是如何选择开始时间以获取最精确的信息。”
最终,该团队提出的方法将实验的机会成本(在本例中为时间)降低了50%。
“我们可以在三个月,而不是六个月内完成实验。” 他说,“这样,我们就可以更快地得到答案。”
Xiong说,Bayati“对问题的思考非常深入” 。
“通过与他的合作,我学到了很多东西—不仅是如何界定问题和制定研究方法,还包括了如何解决问题以及如何撰写和定位论文。” 她说。
Bayati是一位受人尊敬的教授、导师和顾问。今年早些时候,斯坦福商学院博士生协会授予了他博士生导师杰出服务奖,称他为“创新者”、“杰出的应用数学家”和“激发探索乐趣的人” 。
Shirani说,Bayati是一位亲力亲为的导师,他会花时间倾听学生的职业和个人顾虑。有一次,教授陪他在校园里散步了两个小时,Shirani则向他倾诉了自己所面临的压力。还有一次,Bayati在周日到Shirani的办公室与他见面,一起撰写因果信息传递的论文。他还带了自己的小儿子一起来,因为他需要帮儿子做作业。
“在帮助他儿子学习小学数学的同时,我们也正在讨论统计物理论文中的证明问题。” Shirani说。
Shirani说,在研究开始进行几个月后,他差一点就放弃了这篇研究因果信息段落的论文。“我几乎确信这是行不通的。” 他回忆道,“但他告诉我,‘不,请继续努力,我向你保证,你会得到一些很棒的结果。’”
几周后,Shirani果然取得了突破。“我非常高兴,” 他说,“是他鼓励我走上了这条路。”
除了有机会与未来的学者合作之外,Bayati选择学术界而非工业界的原因之一是,教授的工作赋予了他“自由”,让他可以探索自己所选领域中复杂而持久的问题。“作为一名教授,你可以对研究进行长期投资。” 他说。
他享受有时候甚至会长达数年的研究问题的过程——以及“突然发现全新事物”的罕见时刻。
来源:新浪财经