摘要:论文作者:Jingjing Zhai#, Yuzhou Zhang#, Chujun Zhang, Xiaotong Yin, Minggui Song, Chenglong Tang, Pengjun Ding, Zenglin Li,Chuang Ma*
论文题目:deepTFBS: Improving within- and Cross-Species Prediction of Transcription Factor Binding Using Deep Multi-Task and Transfer Learning
论文作者:Jingjing Zhai#, Yuzhou Zhang#, Chujun Zhang, Xiaotong Yin, Minggui Song, Chenglong Tang, Pengjun Ding, Zenglin Li,Chuang Ma*
基于深度学习的组学大数据智能挖掘是当前生物信息学领域的重要研究内容之一。针对转录因子-DNA结合的精确预测问题,本研究提出了一个新的深度学习框架deepTFBS,通过结合大规模转录因子结合位点数据、多任务学习和迁移学习技术进行TFBS预测。deepTFBS能够有效提取并迁移大规模转录因子结合数据中的规律信息,在应对小样本训练和跨物种预测等挑战性任务中表现出色。在对359个拟南芥转录因子的评估中,deepTFBS相较于传统PWM方法、深度学习模型deepSEA和DanQ预测性能上明显提升。在小麦跨物种TFBS预测任务中,deepTFBS的PRAUC比基线模型提高30.6%。以转录因子WUSCHEL(WUS)为案例,进一步通过实验验证证实了deepTFBS的跨物种应用潜力。相较于AgroNT、PDLLMs等预训练大模型相比,deepTFBS在轻量化、速度上更适配特定任务(如,TFBS预测)的大规模基因组分析。该模型已在GitHub平台公开发布(https://github.com/cma2015/deepTFBS),供相关研究人员使用与拓展。
deepTFBS跨物种预测能力为缺乏实验数据的作物(如玉米、小麦)提供了调控网络解析、调控变异筛选、调控元件从头设计等研究新工具。其开源性和跨物种能力尤其适用于资源有限的作物研究,有望加速作物精准育种和功能基因组学的发展。
来源:若若课堂