摘要:2025年4月发表于Nature Communications的论文 “A modular artificial intelligence framework to facilitate fluorophore design” ,构建了人工智能框架 FLAME
2025年4月发表于Nature Communications的论文 “A modular artificial intelligence framework to facilitate fluorophore design” ,构建了人工智能框架 FLAME,加速荧光团设计。研究团队整合开源数据库、预测模型和分子生成器,构建了包含 55,169 个荧光团 - 溶剂对的 FluoDB 数据库,并设计了 FLSF 模型预测光学性质,经过实验验证,该框架可有效加速新型荧光团的设计。提高了荧光团设计效率,为相关领域研究提供了有力工具。
荧光团因其尺寸小、化学可操作性强和成本低等特点,在生物成像等领域应用广泛,但目前其发展面临数据稀疏、结构-性质关系(SPR)复杂等难题。现在,基于机器学习的数据驱动科学为荧光团设计带来新契机,作者研究团队旨在开发更高效的工具来合理设计新型荧光团。
构建 FluoDB 数据库:通过 PubMed 检索文献,整合多个开源数据库数据。经过收集关键数据、处理无效与冗余的数据,标准化荧光团表示,简化溶剂类型,最终构建了FluoDB数据库。它包含 55,169 个荧光团 - 溶剂对,涵盖 16 种核心荧光骨架及 728 个子群,在数据量和分子多样性上优于现有数据库。
图1:用户友好型的框架FLAME概览,该框架整合了最新数据库资源(包括本研究构建的FluoDB数据库及其它预测模型)
设计 FLSF(FLuorescence prediction with fluoroScaFfold-driven model) 模型:融合基于领域知识的荧光骨架指纹(fluoroscaffold)和消息传递神经网络(MPNN)构建 FLSF 模型,用于预测荧光团光学性质,并与其他模型对比评估。在 FluoDB - Lite 数据集上对多种开源预测模型进行测试,结果显示 FLSF 在预测最大吸收波长和最大发射波长方面准确性高,且训练速度比 ABT - MPNN 快 10 倍;在预测具有溶剂变色现象的荧光团的相关参数时,FLSF 也表现出色;与传统的时间相关密度泛函理论(TD - DFT)相比,FLSF 预测误差更小、速度更快。
图2:构建新数据库FluoDB的数据采集与处理通用流程,随后对FluoDB进行系统分析与统计,以可视化不同溶剂中各类荧光团的荧光特性。
作者还从分子、原子层面分别进行了可解释性分析。从分子层面,通过 2D - PCA( (two-dimensional principal component analysis) ) 分析不同状态下 FLSF 的嵌入向量,发现其能有效识别不同波长荧光团的结构特征,且荧光支架信息和溶剂信息的加入提升了模型性能;从原子层面,以香豆素为例,验证了 FLSF 能掌握结构修饰对荧光性质的影响规律,具有良好的泛化能力。
搭建 FLAME (FLuorophore design Acceleration ModulE)框架:将 FluoDB、六种预测模型和分子生成器 Reinvent 4 整合为 FLAME 框架。研究人员可以在该框架内搜索数据库、训练模型、进行光物理性质预测和生成新化合物。
FluoDB 数据分析:发现荧光团光物理参数间存在相关性,如λabs与λem、分子重量(MW)与λabs等呈正相关,溶剂对光学性质影响显著。不同荧光骨架的λabs和λem分布有差异,为筛选荧光骨架提供参考。
FLSF 模型性能:FLSF 在预测λabs(最大吸收波长)和λem(最大发射波长)上表现出色(R^2=0.94 ),对非经典骨架也有良好预测能力,且速度比 ABT-MPNN(atom-bond transformer-based message- passing neural network) 快 10 倍。分子和原子层面的可解释性分析验证了 FLSF 的可靠性和泛化能力。
FLAME 框架应用:以香豆素衍生物设计为例,利用 FLAME 框架设定目标参数,筛选出 3,4 - 恶唑并香豆素。实验结果与 FLSF 预测相符,并成功创制出一种具有明亮荧光且未见报道的新化合物。
FLAME 框架有效加速了新型荧光团设计,FluoDB 数据库提供了丰富数据支持,FLSF 模型预测准确且快速,通过实验成功合成新型荧光团,证明了框架的实用性。未来这一框架可以通过更新数据和算法持续优化,进一步集成合成可及性预测模型和逆合成分析工具,提升荧光团设计和合成的整体效率,推动荧光团及相关领域发展。
参考资料:Zhu, Y., Fang, J., Ahmed, S.A.H. et al. A modular artificial intelligence framework to facilitate fluorophore design. Nat Commun 16, 3598 (2025). https://doi.org/10.1038/s41467-025-58881-5
来源:爱就旅行