摘要:然而,在生物医学实验室中,科研人员往往被复杂的实验方案、庞大的数据库、五花八门的分析工具以及不停更新的海量文献所淹没。生物医学研究日益受到这些重复且分散的工作流程的制约,让科研人员疲于奔命, 严重减缓了科学发现的速度,限制了科学创新。这凸显了科学界对根本性新方
生物医学研究是增进人类对健康和疾病的理解、推动药物研发以及提升临床护理水平的基础。
然而,在生物医学实验室中,科研人员往往被复杂的实验方案、庞大的数据库、五花八门的分析工具以及不停更新的海量文献所淹没。生物医学研究日益受到这些重复且分散的工作流程的制约,让科研人员疲于奔命, 严重减缓了科学发现的速度,限制了科学创新。这凸显了科学界对根本性新方法的迫切需求——一种能够 有效扩展科学专业知识、简化研究工作流程,并充分释放生物医学研究潜力的全新路径。
2025 年 6 月 2 日, 斯坦福大学 黄柯鑫 、 Serena Zhang 、 王瀚宸 、 屈元昊 、 陆荧洲 等研究人员领衔的团队,联合 Genentech、Arc Institute、 加州大学旧金山分校及 普林斯顿大学等 多个顶尖研究机构,发布了一款 通用生物医学 AI 智能体 —— Biomni ,该智能体能够自主完成横跨遗传学、基因组学、微生物学、药理学和临床医学等多个生物医学分支领域的复杂研究任务 。 Biomni 的诞生标志着 AI 在生物医学研究中从“工具使用者”向“自主决策者”的跃迁 。通过将分散的科研资源整合为可操作的 智能体行为单元 ,不仅破解了传统研究流程的碎片化瓶颈,更可能催生跨学科、高通量的自主 化科学发现引擎 。 该研究以: Biomni: A General-Purpose Biomedical AI Agent 为题,发表在了预印本平台 bioRxiv 上,研究团队在 biomni.stanford.edu 开放免费注册和使用 。该研究开发的 Biomni 由两个核心组件构成—— Biomni-E1 和 Biomni-A1 (基于该环境的智能 体 ) 。
Biomni-E1 (统一的生物医学软件和数据环境) :研究团队选取了 2500 篇最新发表的论文(25 个学科类别,每个类别 100篇),利用行动发现大语言模型 智能体逐篇分析这些论文,提取复现或生成相关研究所需的关键任务、工具、数据库和软件资源。Biomni-E1 环境整合了 150 个专业生物医学工具、 105 个专业软件包和 59 个数据库。这些工具均经过人类专家严格验证,特别侧重于具有复杂特性的工具,包括复杂代码实现、领域专业知识或专用 AI 模型。
Biomni-A1 (通用智能 体架构 ) :采用了多项核心创新技术,确保其在生物医学研究领域的有效运行。首先,系统引入基于大语言模型的工具选择机制,专门应对生物医学工具的复杂性和专业性挑战,能够根据用户目标动态检索定制化的资源子集。其次,考虑到生物医学任务通常需要复杂的程序逻辑,Biomni-A1 采用代码作为通用行动接口,使其能够组合执行涉及循环、并行化和条件逻辑的复杂工作流程。第三,智能体运用自适应规划策略,基于生物医学知识制定初始计划,并在执行过程中持续优化改进。
为评估 Biomni 在真实研究任务中的泛化表现,研究团队精心设计了 8 个横跨 遗传学 、 基因组学 、 微生物学 、 药理学 和 临床医学 的全新生物医学基准测试,具体包括:变异优先级排序、 GWAS 因果基因检测、 CRISPR 扰动筛选设计、罕见疾病诊断、药物重定位、单细胞 RNA 测序注释、微生物组疾病 - 分类群关联分析以及患者基因优先级排序。
结果显示,在所有测试任务中, Biomni 展现出显著的性能优势:相较于基础大语言
模型提升 402.3% ,相较于编码智能体提升 43.0% ,相较于自身简化版本 Biomni-ReAct 提升 20.4% ,平均相对性能提升幅度令人瞩目。
实战检验——破解人体“餐后发热”之谜
面对 30 个人连续数月检测的 458 份血糖及体温数据,Biomni 自主生成并执行了一套十步分析流程:从葡萄糖峰值推断用餐事件,提取餐前 / 餐后温度窗口,进行跨个体标准化,并综合分析群体水平趋势,自主发现:
餐后一致的产热反应模式;
餐后平均体温上升 2.19 °C;
个体差异惊人:最低 -0.11 °C vs 最高 15.56 °C;
绘制出 4 类代谢表型图谱 (快速反应型/延迟型等) 。
实战检验—— 解码骨骼发育多组学数据
Biomni 分析了一个最近发表的人类骨骼发育多组学数据集,该数据集包含 336162 个单核 RNA 测序和 ATAC 测序数据点,自主规划并执行了一套十步分析流程,Biomni 能够:
预测转录因子-靶基因调控链接,并基于基序富集和染色质可及性相关性筛选调节因子;
重现了已知的关键成骨转录因子 (例如 RUNX2 、 HHIP ) 间的调控关系;
发现了 AUTS2、ZFHX3 和 PBX1 等 多个此前未被报告的转录因子在多种骨骼细胞了行中的调控作用;
实战检验:设计实验方案
研究团队进一步评估了 Biomni 在实际实验设计中的表现,重点测试其在分子生物学核心任务 —— 基因克隆 方面的能力, Biomni 生成的实验方案在准确性和完整性方面均达到人类专家水平,在实际湿实验验证中,科学家严格按照 Biomni 设计的方案操作,成功完成基因克隆实验,且测序结果显示序列完美匹配。在克隆 B2M 基因的任务中, Biomni 实现了:
100% 实验成功率 (Sanger测序验证) ;
精准设计了 BsmBI 酶切位点;
输出湿实验完整 protocol (退火温度/连接时长精确到秒) 。
为了让每个研究人员都能使用 Biomni 的强大功能,研究团队开发了直观的网络平台——https://biomni.stanford.edu,用户只需提交自然语言查询,即可获得由 Biomni 智能体系统全面支持的分析结果,例如,只需输入“分析我的单细胞数据”,即可零代码操作。最后,研究团队诚邀科学家们探索其功能、测试其极限,并共同创造生物医学发现的新时代。
生物世界 对 Biomni 进行了测试,提问了: I want to identify new genes that regulate ferroptosis. Could you help me design an experimental plan or provide some ideas?
以下是 Biomni 的回答,大约耗时 5 分钟:
来源:东窗史谈一点号