海沟深处蕴藏“惊人”生物多样性;人工智能革命深入蛋白质测序领域 | 前沿动态

360影视 欧美动漫 2025-05-17 10:33 2

摘要:夜幕降临时,几位科学家正乘坐中国载人深海潜水器“奋斗者”号向深渊进发。随着潜水器逐渐下潜,在深不可测的黑暗中,上海交通大学极端环境微生物学家赵维殳瞥见了散发着绿、黄、橙3色荧光的发光生物。抵达万米海底后,研究人员打开探照灯,一片“深邃神秘的蓝色”随即映入眼帘,

原文发表于《科技导报》2025年第8期科技新闻深度报道

海沟深处蕴藏“惊人”生物多样性——3项最新研究揭示神秘超深渊带的生命奥秘

马里亚纳海沟最深处的生物已演化出适应极端高压与寡营养环境的独特生存策略

(图片来源:Science)

夜幕降临时,几位科学家正乘坐中国载人深海潜水器“奋斗者”号向深渊进发。随着潜水器逐渐下潜,在深不可测的黑暗中,上海交通大学极端环境微生物学家赵维殳瞥见了散发着绿、黄、橙3色荧光的发光生物。抵达万米海底后,研究人员打开探照灯,一片“深邃神秘的蓝色”随即映入眼帘,到处漂浮着形形色色的浮游生物。Weishu Zhao回忆道,“那一刻,我幡然领悟,(深海)一定是一个超乎人类想象的奇特世界”。

作为地球最深的海沟,太平洋马里亚纳海沟一直是科学家与探险家的向往之地。2012年,电影导演James Cameron曾乘坐狭小的单人潜水器,下潜至海沟内被称为“挑战者深渊”(Challenger Deep)的海底峡谷,这里深约11000 m,是地球上已知最深的点。其他科考队也曾绘制出马里亚纳海沟奇特的地形图。在2025年3月7日Cell期刊的3篇论文中,科学家向世界揭示了栖息在这片神秘海域的奇异生物。

美国理海大学分子生态学家Santiago Herrera(未参与研究)表示,“这些研究成果为深海生物学发展做出了突出贡献”。作为“溟渊计划”(马里亚纳海沟环境与生态研究计划)的研究项目,这3项研究揭示了地球超深渊带(水深6000~11000 m)神秘莫测的深海密码。超深渊带具有高压、黑暗与寒冷的特点,不仅是威胁生命生存的极端环境,更为大多数科考行动带来艰巨挑战。

为安全抵达万米深渊,研究人员在此次行动中借助了“奋斗者”号载人潜水器,该潜水器被加州大学圣地亚哥分校深海微生物学家Douglas Bartlett誉为“一大工程奇迹”(美国“阿尔文”号深潜器最大下潜深度仅6500 m)。“奋斗者”号可搭载3名科考员下潜至海洋最深处,并配备一对机械臂和采样篮,单次下潜可采集数百份样本。2021年8—11月,“奋斗者”号在马里亚纳海沟及邻近海域完成数十次深潜作业,带回微生物沉积物、鱼类、片脚类甲壳动物等许多珍贵样本。

Bartlett指出,“我们发现了异常繁荣的生物多样性”。其中一项研究鉴定出马里亚纳海沟内的7000余种新微生物,其中89%为科学界未报道的新物种。论文合著者、华大生命科学研究院(BGI Research)生物学家Mo Han表示,这些微生物进化出了在黑暗、寡营养环境中的独特生存策略。基因分析结果显示,有些微生物拥有精简高效的小型基因组,能够进化出特定的生命机能,有些微生物则拥有能适应环境变化的大型多能基因组,某些物种甚至具备降解一氧化碳等顽固物质的基因。Mo Han感叹道,“生命总会自己找到出路。”

另一项研究指出,片脚类生物可能通过与深海细菌建立共生关系来适应极端环境,论文合著者、华大集团研究员Shanshan Liu表示,这种能力使其成为超深渊带中最具韧性的生物。肠道内容物分析显示,片脚类甲壳动物体内富含大量冷单胞菌属(Psychromonas)。研究人员推测,这类细菌也许可以协助合成一种名为三甲胺N-氧化物的化合物,该物质广泛存在于多种深海生物体内,可以帮助机体维持体液平衡,抵御高压环境带来的生理损伤。

第3项研究则揭示,生活在水深3000 m以下的鱼类普遍存在基因突变,使它们的细胞能够更高效地将基因转录为必需蛋白质,从而快速应对高压、寒冷和黑暗带来的应激反应。通过分析11个物种的基因组,研究人员成功追溯到部分物种最初迁入深海的时间节点。例如,鳗鱼可能在约1亿年前潜入深海,成功躲过6500万年前导致恐龙和浅海生物灭绝的大灾难;而狮子鱼可能在约2000万年前潜入海沟,与板块剧烈活动时期大致吻合。对此,论文合著者、华大集团研究员Yue Song认为,在温度与氧气环境剧烈波动的时期,深海可能充当了这些生物的“生态避难所”。

在揭示超深渊带生命繁荣的生态密码之余,研究人员也目睹了触目惊心的人类活动痕迹。据Weishu Zhao回忆,潜水团队不仅发现了塑料袋、啤酒瓶和易拉罐,甚至在雅浦海沟最深处发现了近乎完整的洗衣篮。Weishu Zhao表示,“这让我们倍感震惊”。但同时,她也指出,深海微生物展现出惊人的污染物降解能力,甚至能将其转化为能量来源,这些生物“或许能为人类突破当今环境污染困境提供新思路”。

未来,研究团队计划进一步考察世界其他地区的深海海沟,或将为揭秘地球生命起源提供更多线索。华大集团研究员Liang Meng表示,“全球80%的超深渊带仍是未解之谜,在这片未被探索的神秘海域中,或许还蕴藏着无尽的生命宝藏”。

文/Phie Jacobs

由Elizabeth Pennisi协助报道(译自Science,2025,387(6739))

人工智能革命深入蛋白质测序领域——新型系统揭示未知蛋白质的奥秘

e

人工智能(AI)已经彻底改变蛋白质三维折叠结构的研究,相关成就获得了2024年诺贝尔化学奖。如今,AI革命正在深入蛋白质测序领域,赋能科学家通过组成蛋白质的氨基酸序列识别蛋白质。与传统方法相比,AI技术通常效率更高,同时还能帮助研究人员对未知的蛋白质进行测序。未知蛋白质测序一直是限制医学诊断、环境研究和考古学研究的常见挑战。

2025年3月,欧洲研究人员在发表于Nature Machine Intelligence的一项研究成果中称,AI模型InstaNovo能够识别伤口中的致病蛋白质,以及海水样本中微生物发酵产生的未知蛋白质。InstaNovo的研究并非个例。过去4年,研究人员已推出超过20种蛋白质测序AI模型。华盛顿大学蛋白质组学AI模型开发者William Noble表示,“很显然,该领域研究正开启探索的新纪元。”

蛋白质测序AI工具在其他领域研究中得到了广泛应用。例如,进化生物学家正利用这些工具识别古蛋白质,相关研究可能会揭示现代人类与已灭绝古人类之间的差异。哥本哈根大学古蛋白质组学专家Enrico Cappellini表示,“AI工具已展示出初步潜力,有望在未来研究中展现出强大的赋能实力”。

蛋白质远比脱氧核糖核酸(DNA)和核糖核酸(RNA)要复杂得多。例如,人类基因组中约包含2万个基因,但这些基因能产生1000万种不同的蛋白质,这是因为在DNA转录为RNA或RNA翻译为蛋白质时可能发生变异,而蛋白质本身也会经历多种化学修饰。

在传统方法中,生物学家通过将蛋白质分解成较短的肽段来鉴定蛋白质,每个肽段由5~20个氨基酸组成。科学家使用质谱仪测定这些肽段的质量,通过比对数十个数据库中的已知肽段鉴定其身份,最后拼接出完整分子。

但这种方法存在诸多局限性。首先,质谱法鉴定出的多达70%的肽在现有数据库中均无明确记录。丹麦技术大学蛋白质组学专家Timothy Patrick Jenkins表示,“传统的蛋白质组学有点类似谷歌搜索,如果数据库没有收录,搜索匹配自然无从谈起”。随着肽段数据库范围持续扩大,匹配所需的计算耗时也越来越长。

新型AI测序技术不再拘泥于已知肽段的搜索与匹配,而是计算特定长度肽段经过化学修饰后可能产生的所有肽段的质量。若AI捕捉的片段可以与实际样本相匹配,就会尝试将其拼接成全长蛋白质。

为提高准确性,蛋白质测序AI工具在识别已知肽段及如何将其拼接成已知蛋白质方面接受过数百万次训练,掌握了氨基酸链最常见的组合方式。Jenkins指出,这种方式类似ChatGPT等大语言模型(LLM)的训练方式,后者依靠海量文本训练来学习语法规则。大语言模型能够判断出“the boy bounces a ball”比“bounces a ball the boy”更符合语法,蛋白质组学算法也能通过训练掌握某种“蛋白质语法”,从而基于特定肽段推断出最有可能的序列。

2021年,Noble及其团队推出一种名为Casanovo的模型,这是首个基于深度神经网络的蛋白质测序AI模型。深度神经网络也是ChatGPT的算法原理。2024年,Noble团队在发表于Nature Communications的一项研究中证实,该模型可以解码出训练数据以外新的肽段序列。另有实验表明,Casanovo尤其擅长识别免疫系统攻击癌细胞时靶向的细胞表面肽以及海水样本中的未知蛋白质。

Jenkins及其团队基于这些成果开发了InstaNovo模型。该模型同样采用深度学习神经网络,但创新性地引入扩散策略,在前者的基础上实现了升级。扩散策略已广泛应用于DALL-E等AI图像生成模型,以及RoseTTAFold、AlphaFold等蛋白质结构预测模型。扩散模型会先在输入数据中添加随机噪声,然后进行去噪,观察去噪过程如何锐化输出结果,并在此基础上进行更大范围去噪,实现进一步锐化。在Nature Machine Intelligence发表的一项研究中证实,在与Casanovo模型的对比测试中,通过结合Instan‐Novo+优化模型,InstaNovo模型可以从9种生物的人工合成蛋白质中多鉴定出42%的肽段数量。

在蛋白质组学实际应用中,该团队发现,InstaNovo模型不仅从腿部感染伤口中鉴定出1225种血液白蛋白的独特肽段(比传统数据库检索多出10倍),其中254种为数据库未收录的新肽段,而且成功定位了52种细菌蛋白的相关肽段。对此,协助研究人员进行组织蛋白质图谱分析的Atlas Antibodies公司研发主管Catrine Soiberg表示,InstaNovo模型“有望解析复杂样本,提供创新解决方案”。Noble率先认识到InstaNovo模型的潜力,并进行了全面测试,感叹这是“真正的突破”。

这项新技术在其他领域的应用也在加速落地。剑桥大学蛋白质组学研究者Matthew Collins正利用多种AI蛋白质测序工具分析考古样本。多数情况下,考古样本中的蛋白质因长期埋藏产生复杂的化学变化,或是源于早已灭绝的动植物,因此,传统的蛋白质和肽段数据库往往缺乏记录。借助这些AI工具,该团队在尼安德特人遗址中发现了兔类蛋白质的痕迹,为研究尼安德特人(现代人类的近亲)的饮食习惯提供了宝贵线索,此外,团队还在古代巴西的陶器中检测到了鱼类肌肉蛋白。Collins表示,“(这些模型)拥有巨大的潜力,我们已将全部研究工作转向依托其开展。可以说,这是一次质的飞跃”。

文/Robert F. Service

(译自Science,2025,388(6743))

《科技导报》创刊于1980年,中国科协学术会刊,主要刊登科学前沿和技术热点领域突破性的成果报道、权威性的科学评论、引领性的高端综述,发表促进经济社会发展、完善科技管理、优化科研环境、培育科学文化、促进科技创新和科技成果转化的决策咨询建议。常设栏目有院士卷首语、智库观点、科技评论、热点专题、综述、论文、学术聚焦、科学人文等。

来源:科技导报

相关推荐