摘要:2022年,英国、加拿大、中国、美国、瑞典、德国六国科学家发起了“未充分研究蛋白质计划” (Understudied Proteins Initiative) ,旨在破解这些未知的“暗物质”蛋白质,拓展对生物大分子的认知边界。随着核糖体测序、深度测序、质谱技术
2022年,英国、加拿大、中国、美国、瑞典、德国六国科学家发起了“未充分研究蛋白质计划” (Understudied Proteins Initiative) ,旨在破解这些未知的“暗物质”蛋白质,拓展对生物大分子的认知边界。随着核糖体测序、深度测序、质谱技术突破,以及翻译组、转录组与蛋白质组研究深入交叉,学界发现一类由非编码RNA编码的长度较短的蛋白质,即“微肽”的存在,编码微肽的基因序列被称为“短开放阅读框” (Short open reading frames, sORF) 。目前研究证实,sORF编码的微肽,作为一类具有重要生物学功能的新型生物分子,其在能量代谢、免疫应答、翻译网络调控等诸多细胞活动中扮演重要角色,其异常表达与包括肿瘤在内的重大疾病发生密切相关。
计算生物学的发展与生物大分子检测技术的进步为生命科学研究提供了崭新思路与可靠工具,在基因组与遗传信息研究中采用数据驱动的动态化、多维度、全景式研究新范式或将提升生命科学理论认知。由此,发展计算生物学分析方法和新的鉴定技术,实现对人类微肽的全景测绘、基因座分布解析及生物调控功能阐释,或将革新对人类功能基因组与蛋白质组的理论认知,并对肿瘤等人类重大疾病诊疗干预提供临床借鉴。
2025年1月10日,浙江大学林爱福课题组在Cell Research杂志在线发表题为Comprehensive Discovery and Functional Characterization of the Noncanonical Proteome的研究论文。该研究通过构建微肽开发阅读框参考数据库与开发超滤浓缩质谱鉴定体系,测绘了胃癌微肽图谱,并基于CRISPR功能筛选、AI结构模拟与微肽-蛋白质互作网络(mPPI)开发微肽功能预测框架,相关研究发现或为人类微肽研究提供研究工具与数据资源。
目前,传统的微肽鉴定主要依赖于核糖体测序 (Ribo-Seq) 等技术。由于Ribo-Seq主要基于RNA测序,无法提供蛋白质组水平的直接证据。微肽序列相对较短、丰度相对较低,质谱技术作为蛋白质鉴定的金标准,在传统的蛋白质组学研究中常常被忽视或遗漏。为了克服上述研究局限,研究者对微肽参考数据库和靶向检测技术进行了针对性改进。一方面,研究者们通过系统分析人类参考转录组,成功构建包含理论上所有11,668,944个微肽开放阅读框 (ORF) 及其序列的微肽参考数据库。另一方面,在样本处理过程中,采用连续超滤浓缩 (30-10-3 kDa) 的方法,尽可能滤除经典蛋白质,减少其信号干扰,从而增强微肽的信号,最终实现高精度、高覆盖度、高通量的微肽鉴定。
图1:靶向微肽的鉴定技术优化开发与命名规则设计
借助上述微肽质谱鉴定体系,研究者在胃癌临床样本和细胞系中共鉴定出8945条尚未被注释的微肽,并以此构建人类胃癌微肽组,并设计基于“阅读框顺位-基因类型-基因名”的微肽命名规则以规范整合微肽信息。值得注意的是,其中50.3%的微肽来源于先前认为不具备编码能力的非编码RNA (ncRNA) 。这些ncRNA来源的微肽序列更短,物种间保守性更差,提示它们的翻译过程和功能可能具有物种特异性。基于细胞增殖的CRISPR筛选进一步揭示1161条ncRNA来源的微肽与胃癌细胞增殖存在强关联,其中超过80%的微肽发挥促癌功能。为了验证微肽库的真实可靠性,研究者们采用了多层次、分级的验证策略,包括微肽-标签质粒构建、多聚核糖体分析、Flag-Knock In技术以及抗体制备等方法,表明该数据集真实可靠,揭示了数量众多、功能重要但在先前研究中被忽视的微肽分子。
图2:人类胃癌微肽组性质分析与CRISPR筛选
为了更好地阐明这些微肽的功能,研究者结合AlphaFold2和ClusPro等计算生物学工具,构建了基于加权相关网络分析的深度学习算法,用于分析微肽的高级结构信息,并通过全蛋白质组对接,筛选出与微肽高置信度互作的蛋白质,并建立了基于肽-蛋白质互作网络 (mPPI) 的功能注释框架和功能谱图。该分析框架揭示微肽丰富的亚细胞定位,对线粒体、溶酶体等细胞器的正常功能行使具有重要的调控作用,并参与细胞能量代谢、营养信号感知等一系列生命活动。基于此预测框架,研究者验证了其中四个代表性微肽pep1-nc-OLMALINC、pep5-nc-TRHDE-AS1、pep-nc-ZNF436-AS1和pep2-nc-AC027045.3的互作蛋白质组及其相应的亚细胞定位和功能,并通过动物模型和临床样本阐明了它们在胃癌治疗中作为标志物和靶点的潜在临床应用价值。
图3:基于加权相关网络分析的微肽功能预测框架开发
总的来说,本研究通过构建人类微肽开放阅读框参考库与开发超滤浓缩微肽质谱鉴定体系,成功绘制了人类胃癌微肽图谱,并开发了基于结构-互作的微肽功能预测框架,对功能性微肽进行了系统地筛选鉴定,为人类微肽研究提供了重要工具与数据资源的同时,形成对人类功能基因组与蛋白质组的重要补充,也为胃癌靶点与药物开发提供了理论依据。
此外,研究者团队进一步利用该微肽开放阅读框参考数据库对CPTAC中的蛋白质组数据进行从头分析,成功从乳腺癌、肾透明细胞癌等8类癌种中鉴定到19,586个ncRNA来源的微肽。并进一步关联数据库中的蛋白质组学和转录组学数据,将预后等临床特征纳入整合分析,阐明各种癌症类型中不同的微肽表达模式与生理病理效应,构建了基于公共数据库的人类肿瘤关联肽数据集。研究者进一步应用加权相关网络分析功能预测框架,对上述微肽进行系统功能预测,相关内容最终集成人类微肽谱图 (Human Micropeptide Atlas, HMPA) ,并于近日以题为HMPA: A Pioneering Framework for the Noncanonical Peptidome from Discovery to Functional Insights的数据库发表于Briefings In Bioinformatics。
该数据库提供基于转录本、基因名的微肽搜索功能,并完整收录各微肽的基本信息 (基因名、序列、阅读框坐标等) 、预测的亚细胞定位、物理化学性质、代表性MS谱图及预测的结构与mPPI互作网络。该数据库可通过hmpa.zju.edu.cn访问,后续将持续更新,将为微肽研究提供便捷、多维的可视化工具,为精准医学和后基因组治疗提供数据支持。
图4 – HMPA设计与功能框架
浙江大学林爱福、周天华为Cell Research论文的通讯作者。石成瑜、刘方舟与苏心婉为论文的共同第一作者。浙江大学林爱福、周天华与孙强为Briefings In Bioinformatics论文的通讯作者。苏心婉与石成瑜为Briefings In Bioinformatics共同第一作者。研究工作也得到了西湖大学李旭等合作者的大力支持。
目前该团队欢迎对RNA生物医学、肿瘤生物学方向感兴趣的青年才俊加盟 (提供博士后及特聘研究员、副研究员等岗位) 。
制版人:十一
BioART战略合作伙伴
来源:科学任我说