人工智能在科学研究中的应用是“快点”一种确保可靠性的迭代方法

360影视 2025-01-15 20:30 2

摘要:进入新的一年意味着 IT 投资的新重点。 研究公司 Gartner 预测,到 2025 年,全球 IT 支出将达到 5.74 万亿美元,比上一年增长 9.3%。 他说,对生成式 AI 的追求将推动支出的增加。

进入新的一年意味着 IT 投资的新重点。 研究公司 Gartner 预测,到 2025 年,全球 IT 支出将达到 5.74 万亿美元,比上一年增长 9.3%。 他说,对生成式 AI 的追求将推动支出的增加。

到目前为止,我们中的许多人都尝试过生成式 AI。 无论是优化文本、创建照片还是生成代码,该技术的功能都让人感觉很神奇。

但是,一些数字领导者,如弗朗西斯·克里克研究所 (Francis Crick Institute) 的首席信息官詹姆斯·弗莱明 (James Fleming),不允许他们的组织被炒作冲昏头脑。

他告诉 ZDNET,将新兴技术转化为创新的科学发现并不容易。 由于这一挑战,世界领先的研究机构之一弗朗西斯·克里克研究所 (Francis Crick Institute) 的运作方式并没有随着生成式 AI 的兴起而发生重大变化。

“在科学中使用 AI 是一回事,创建公开可用的大型语言模型 (LLM) 是另一回事,在受限的科学世界中,任何人都必须证明他们的假设,”Fleming 说。

“仅仅说你发布了一个几乎正确的模型是不够的,在大多数情况下,你需要创建一个在某些条件下完全正确的模型。 此外,我们必须证明我们的研究结果是基于基本理解的。

弗莱明将人工智能在科学中的应用描述为一把“双刃剑”。 新兴技术可能有助于加快研究过程,但在产生和提出新结论时需要高度的确定性。

“能够证明非常重要,特别是如果你正在研究可能影响现实世界的诊所或医疗设备的东西,”弗莱明说。

“例如,如果你向临床医生展示一项创新,并说,'我认为这个工具可以预测癌症的进展',他们会说,'你真的能做到吗?

可解释性在科学研究中至关重要,但这种关注点与许多常见 AI 模型的黑盒机制和和平静度不兼容。

因此,为了揭示新兴技术的过程,弗朗西斯·克里克研究所 (Francis Crick Institute) 使用迭代方法确保研究人员可以放心地采用 AI 模型。

“我们需要慢慢地、循序渐进地朝着我们的目标迈进,”弗莱明说。 “我们从一开始就采取了非常专注的方法,其中数据来源清晰可靠。”

弗朗西斯克里克研究所的增量方法支持研究人员以两种方式部署 AI 模型。

首先是加强现有的科学方法。 据 Fleming 称,该研究所在五年前就开始了显微镜研究。

弗朗西斯·克里克研究所 (Francis Crick Institute) 的显微镜设施分析低温电子,以创建组织、细胞和单个分子的美丽、高密度图像。

但创建精美的图像只是一个起点。 这些图像需要转换为数据,以便它们可以用于提供详细信息,从而帮助他们区分癌细胞和非癌细胞。

通过迭代方法,Fleming 的团队已经证明,使用正确的模型,可以在更短的时间内产生突破性的研究结果。

“AI 模型可以代表人类执行许多繁琐的任务,例如分析和提取特征,以及将图像转换为数据以指导人类理解,”他说。

弗朗西斯·克里克研究所使用 AI 的第二个领域与发现有关,这非常受限制。

弗莱明举了一个实验室对帕金森病的研究的例子。 该团队开发了一种分类工具,用于从干细胞群体中识别哪些患者患有帕金森病。 然而,由于无法解释其机制,我们反复地朝着相反的方向进行研究。

“在模型训练完成后,有一个使用各种统计方法向后看模型的过程,我们说,'实际上,最主要的是单元的椭圆度,它更像是一个椭圆。 该模型随后提取了许多其他特征。

这些结果本身并不是答案,但它们确实鼓励了下一项研究。 “'是的,细胞形态不同,我不知道为什么。 我们下次实验应该怎么做呢? 这就是需要迭代方法的地方。

根据弗莱明的说法,弗朗西斯·克里克研究所 (Francis Crick Institute) 逐步测试和改进 AI 技术的谨慎过程导致了一种更复杂的方法,该方法允许集成多个 AI 以创建可靠的研究计划。

最大的项目由 Samra Turaljic 领导,他的癌症动力学实验室专注于了解肾癌的进展情况。

该团队使用 AI 从病理图像中预测肿瘤的基因组进化。 Fleming 说,这项工作涉及使用基于 10 年研究的基因组数据库训练多个 AI 和交叉训练模型。

“因此,我们将创造出可以在临床上预测肾癌进展的东西,”弗莱明说。

“但在每个过程中,我们都会精心组装子组件,使它们达到信任水平,并处理多层数据以近似真实世界人口的规模。”

Fleming 说,这种高度详细的方法很重要,因为生物和图像质量的变化,例如病理切片上染色强度的差异,会影响结果。

这个循序渐进的过程证明,从长远来看,短期内缓慢、连续的工作是从 AI 中获得快速结果的关键。

每个人都可以从这个角度学习。 这是因为在 AI 时代,供应商炒作是只需单击一下即可为棘手问题提供出色的解决方案。

“你从一个小数据集开始,你理解它,你让它变得可预测并且有效,然后你引入更多的数据,”Fleming 说。

“当你添加数据时,你会再次优化模型,这个迭代过程至关重要。 因为如果你不这样做,你就无法建立理解和数据来源。

来源:科技平行论

相关推荐