摘要:针对蛋白特性的定向进化是蛋白质工程的“利器”,但是实验比较繁琐,且容易陷入局部最优[1]。一些基于蛋白语言模型的虚拟进化工具虽然避免了复杂的实验,但是提供的帮助也有限,毕竟蛋白的适应性和活性很多时候并没有直接的关联[2]。
针对蛋白特性的定向进化是蛋白质工程的“利器”,但是实验比较繁琐,且容易陷入局部最优[1]。一些基于蛋白语言模型的虚拟进化工具虽然避免了复杂的实验,但是提供的帮助也有限,毕竟蛋白的适应性和活性很多时候并没有直接的关联[2]。
为此,哈佛医学院Omar O. Abudayyeh以及Jonathan S. Gootenberg等研究人员开发新框架-EVOLVEpro(evolution via language model–guided variance exploration for proteins) ,在蛋白语言模型[3]的基础上,进一步结合回归模型(random forest regression)来从迭代的实验中主动学习蛋白活性的 “地貌图”,从而实现直接以蛋白活性,乃至结合预设的其它多种性能指标(表达量、引发的免疫反应强度等)为目标的高效蛋白进化[3]。
EVOLVEpro概览[3]。
进一步,研究人员通过EVOLVEpro实现了更强结合的抗体、更高效的基因编辑以及更高质/量的RNA表达等,其中某些性能参数提高百倍以上[3]。
通过EVOLVEpro定向进化更强结合且易于表达的抗体[3]。
该项工作2024年11月21日发表在Science[3]。
研究人员表示接下来结合进一步的蛋白语言模型和强化的搜索策略(比如进一步结合生物物理模型),该方法将进一步帮助蛋白工程[3]。
Comment(s):
非常实用的工具;
看来特别适合与蛋白从头设计结合,快速产生强效的功能蛋白。
参考文献:
[1] D. M. Fowler and S. Fields, “Deep mutational scanning: a new style of protein science.,” Nat. Methods, vol. 11, no. 8, pp. 801–807, Aug. 2014, doi: 10.1038/nmeth.3027.
[2] K. Jiang et al., “Rapid in silico directed evolution by a protein language model with EVOLVEpro,” Science (80-. )., vol. 0, no. 0, p. eadr6006, Nov. 2024, doi: 10.1126/science.adr6006.
[3] Z. Lin et al., “Evolutionary-scale prediction of atomic-level protein structure with a language model.,” Science, vol. 379, no. 6637, pp. 1123–1130, Mar. 2023, doi: 10.1126/science.ade2574.
原文链接:
来源:小叶运动