科大讯飞与中国地质大学(武汉)联合发布“元古大模型”

摘要:12月7日,在中国古生物学会新技术新方法专业委员会(筹)第一届会员代表大会暨第一届一次学术年会上,由科大讯飞与中国地质大学(武汉)深度合作,以产学研协同的模式开展研究,打造的地球科学领域垂直大模型——“元古大模型”正式发布。

12月7日,在中国古生物学会新技术新方法专业委员会(筹)第一届会员代表大会暨第一届一次学术年会上,由科大讯飞与中国地质大学(武汉)深度合作,以产学研协同的模式开展研究,打造的地球科学领域垂直大模型——“元古大模型”正式发布。

“元古大模型”正式发布

产学研紧密协同

探索地球科学研究新范式

今年3月,教育部实施教育系统人工智能大模型应用示范行动(LEAD行动),通过有组织攻关与开放生态协同相结合,打造中国版人工智能教育大模型。为了推动人工智能与地球科学的深度融合,科大讯飞与中国地质大学(武汉)强强联合,探索产学研协同创新的新模式,按照专家定义学科难题、师生参与数据处理、校企共同训练迭代、信息化部门挖掘应用场景的模式开展学科大模型研究。

2023年11月,科大讯飞与中国地质大学(武汉)启动战略合作

以高质量数据为基

不断攻克地球科学领域难题

依托中国地质大学(武汉)地球科学学院宋海军教授团队在地球生物学领域的研究成果,研究团队对62万多张古生物化石图片、3000篇地学文献的45万余条地质实体与属性进行数据清洗与标注,这些数据构成了千亿参数的“元古大模型”基石。

依托处理后的高质量地学数据集,团队采用预训练和微调相结合的方法,完成了对古生物化石图片识别和地学文献实体抽取任务的训练,并利用大模型技术,实现了古生物化石的复原工作。区别于传统机器学习方法,“元古大模型”综合运用了图生文、文生图、文生文的生成式预训练模型架构,成功验证了在全国产化算力和算法基础上,利用多模态大模型技术解决地球科学领域问题的技术可行性。

产学研协同推进

加速科研成果向实际应用转化

“元古大模型”的体系架构是一个综合性框架,旨在通过云端运行的智能算力基础设施和多模态大模型集成能力,形成一个全面、高效的地球科学研究、教育教学和社会服务为一体的智能化系统。目前,已推出古生物化石标本识别助手、地质文献数据挖掘助手和古生物学智能知识问答助手,并将陆续上线地学智能搜索引擎和古生物科普数字人,为地球科学专业的学生、地质工作者等提供全方位的教学、实践、科研及服务支持。

古生物化石标本识别助手:能够识别120类常见的古生物化石、岩石,并能以科学工作者视角精细化描述化石数量、颜色、外形结构等多维度信息,并基于化石结构推理出化石种类。目前其能力已同步训练到星火大模型最新版本,可供公众及地学科研工作者调用和使用,实现科研成果向社会服务转化。

地质文献数据挖掘助手:依托训练完成的地学文献实体抽取任务,通过大模型辅助地学文献研读、自动抽取地学领域实体和属性,攻克了由于专业术语多、信息的隐式表达、数据稀缺导致的通用大模型实体抽取覆盖率低等技术难点,为基于大规模文献揭示极地温度演化新规律、发现古生物、古环境等领域的新规律提供有力的工具支持。

地质文献数据挖掘助手-实体抽取

此外,面向师生及地质工作者打造的地学智能搜索引擎也将逐步开放。该引擎基于“元古大模型”强大的的推理能力,可实现地学专业知识的即问即答,以及面向各类地学专业网站科普资源、公开的地学音视频资源、预印本网站论文等丰富数据的精准搜索。

地质文献数据挖掘助手-实体抽取

“元古”,来自于地质时代“元古宙”,是地球历史上存在时间最久的一个宙,也是智力起源的时代,真核生命、多细胞生命和动物均起源于元古宙。“元古”寓意着地球科学的古老与深邃,也象征着智慧与创新的崭新起点,是地球科学领域深刻变革的星星之火。未来,“元古大模型”将以“科研工作者的科研助手”“地大学习者的良师益友”“地质工作者的勘探利器”“地学爱好者的百科全书”为最终目标,不断优化数据质量、丰富数据类型、训练科学任务、开发创新应用、提供多样化的应用场景,为地球科学学科发展作出新贡献。

今年10月24日科大讯飞发布的讯飞星火4.0 Turbo是基于全国首个国产万卡算力集群“飞星一号”训练的全民开放大模型,根据真实数据背靠背的测试,讯飞星火4.0 Turbo七项核心能力在中文领域全面超过GPT-4 Turbo,代码能力和数学能力超越GPT-4o,同时,国产超大规模智算平台“飞星二号”也已正式启动。基于上述自主可控的技术优势,科大讯飞已成为全国多所高校大模型解决方案的重要合作伙伴,为高等教育数字化转型与人才培养持续注入新的动能。

来源:科大讯飞一点号

相关推荐