Arc Institute发起虚拟细胞挑战赛,个人、团体均可参赛,角逐10万美元大奖

360影视 日韩动漫 2025-06-27 18:30 2

摘要:2024 年 12 月,Cell 期刊发表了一篇题为“How to build the virtual cell with artificial intelligence: Priorities and opportunities”的文章,该文章提议全球携手合

细胞对于理解健康和疾病至关重要,但传统模型无法对其功能和行为进行建模和模拟。人工智能和组学的进步为创建人工智能虚拟细胞 (AIVC) 提供了突破性的机会。

这些所谓的“虚拟细胞”可以帮助研究人员发现新药,能够将细胞从“患病”状态转变为“健康”状态,同时减少脱靶效应,从而提高临床成功率。

2024 年 12 月,Cell 期刊发表了一篇题为“How to build the virtual cell with artificial intelligence: Priorities and opportunities”的文章,该文章提议全球携手合作,打造世界上第一个人工智能虚拟细胞;与此同时,来自斯坦福大学、 基因泰克和陈-扎克伯格倡议的研究团队表示,鉴于人工智能的快速发展和海量数据的生产,科学界正迎来前所未有的机遇来创造世界上第一个虚拟人体细胞。

在虚拟细胞基准测试与加速研究领域迈出重要一步之际,Arc Institute 宣布启动首届“虚拟细胞挑战赛”。这项由英伟达、10x Genomics 和 Ultima Genomics 联合赞助的公开竞赛,排名前三的模型将分别赢得价值 100,000 美元、50,000 美元25,000 美元的奖金。

该挑战赛的详细说明已发表在 Cell 期刊的最新评论文章中,题为“Virtual Cell Challenge: Toward a Turing test for the virtual cell”。

此项倡议效仿了蛋白质结构预测关键评估(CASP)竞赛的模式——这个每两年举办一次的实验性竞赛旨在评估结构生物学领域的最新尖端模型。Arc Institute 联合创始人兼核心研究员 Patrick Hsu 博士强调,CASP 竞赛在 25 年间彻底改变了蛋白质结构预测领域,最终催生了诸如 AlphaFold 等突破性成果。“我们相信,Arc 可以采用相同的方法加速综合性虚拟细胞的研发进程,这将从根本上改变我们研究生物学的方式,并为治疗复杂疾病找到更优的靶点。

据悉,该竞赛将每年举办一次,首届挑战赛将于 2025 年 6 月至 11 月举行。

(来源:挑战赛官网)

个人、团体均可参赛

Arc Institute 由 Hsu 和斯坦福大学生物化学助理教授兼 Arc 现任执行董事 Silvana Konermann 博士于 2021 年创立。自那时起,该研究所就以在数据驱动型人工智能领域投入巨资而闻名。今年早些时候,Arc 与英伟达合作,发布了当时被誉为最大的公开可用生物学人工智能模型 Evo 2。

2025 年首届竞赛,参赛者将预测单基因扰动在测试细胞类型中的影响。

Arc Institute 精心构建了一个包含 30 万个人类胚胎干细胞(H1 hESC)的单细胞转录组的数据集,涵盖 300 种基因扰动。该数据集将作为整个竞赛的关键基准,被划分为模型微调、验证和最终测试三个阶段。

虚拟细胞挑战赛参赛者可利用包括 Arc 虚拟细胞图谱在内的公共数据库进行模型训练,通过不断优化模型,精准预测当特定基因被沉默时引发的基因活性变化。该图谱整合了 scBaseCount 和 Tahoe-100M 等大型单细胞数据集,总细胞量超 5 亿。

其他可用数据集包括 X-Atlas/Orion 等。AI 制药独角兽 Xaira Therapeutics 上周发布的全球最大公开 Perturb-seq 数据集,其独特优势在于量化了剂量依赖性遗传效应(如精确界定药物靶点产生预期疗效所需的抑制百分比)。Xaira 目前正与生物医学 AI 负责人、多伦多大学知名学者 Wang Bo 博士(单细胞多组学基础模型 scGPT 发明者)合作开发虚拟细胞模型。scGPT 具备细胞类型注释、扰动响应预测和基因网络推断等下游能力。

参赛模型将通过以下三个维度进行评估:差异表达评分,衡量模型预测差异表达基因的准确度;扰动区分评分,根据预测扰动与真实效应的相似度进行排序评估;平均绝对误差(MAE),反映全基因组表达谱的整体预测精度。最终采用综合评分制(总分),根据训练数据集细胞均值模型设定的基线,对三项指标进行加权计算。

图 | 虚拟细胞挑战赛概览(来源:Cell)

赛事中期将实时公布模型表现的动态排行榜。最终优胜的三支团队将分获价值 10 万美元、5 万美元和 2.5 万美元的奖励(含现金奖金与 NVIDIA DGX 云服务积分)。

目前,竞赛报名已启动,高校、生物技术企业与独立研究机构的团队或个人研究者均可参赛。最终排名将完全基于 2025 年 10 月下旬发布的终极测试集表现(提交截止前一周公布),获奖名单拟于 2025 年 12 月正式揭晓。

先与 Arc 虚拟细胞模型角逐

作为基准参照,虚拟细胞挑战赛的参赛者将首先与 Arc Institute 的首个虚拟细胞模型 STATE 展开角逐。该模型专为预测干细胞、癌细胞及免疫细胞对药物、细胞因子或基因扰动的反应而设计,已于本周早些时候面向非商业用途发布,相关预印本论文(尚未经同行评审)已同步公开于 Arc 官网。

据开发者披露,STATE 模型在多项大型数据集上实现了超过 50% 的扰动效应判别能力提升,对基因、信号传导及化学扰动引发的差异表达基因识别准确度达到现有模型的 2 倍以上

为增强灵活性与可扩展性,STATE 采用双模块耦合架构

状态转换模型(ST):基于来自 70 种实验场景、超 1 亿个扰动细胞的训练数据,创新采用双向 Transformer 架构。与现有单细胞预测模型不同,ST 能对细胞群体进行整体预测,无需依赖显式分布假设即可灵活捕捉生物异质性与技术噪声。

状态嵌入模型(SE):通过 1.67 亿个人类细胞的观测单细胞数据训练,可识别跨数据集的基因表达变异。该模块生成的表征对技术噪声具有强鲁棒性,使 STATE 能高效整合多个大型数据集进行训练。

(来源:Arc Institute)

首届赛事聚焦单细胞类型的遗传扰动预测,未来将拓展至:组合扰动与跨细胞类型泛化、整合转录组、蛋白质组、表观组等多模态数据、开发逆向扰动设计能力(针对特定疗效优化扰动方案)评估框架将随领域认知迭代升级。

参考链接:

1.https://www.cell.com/cell/fulltext/S0092-8674(25)00675-0

2.https://arcinstitute.org/news/virtual-cell-model-state

3.https://virtualcellchallenge.org/

免责声明:本文旨在传递合成生物学最新讯息,不代表平台立场,不构成任何投资意见和建议,以官方/公司公告为准。本文也不是治疗方案推荐,如需获得治疗方案指导,请前往正规医院就诊。

来源:生辉SciPhi

相关推荐