航天信息申请用于大语言模型的财税训练数据处理方法及系统专利,解决财税行业高质量训练数据难以构建的问题

360影视 欧美动漫 2025-05-26 08:21 3

摘要:国家知识产权局信息显示,航天信息股份有限公司申请一项名为“一种用于大语言模型的财税训练数据处理方法及系统”的专利,公开号CN120030342A,申请日期为2024年12月。

金融界2025年5月26日消息,国家知识产权局信息显示,航天信息股份有限公司申请一项名为“一种用于大语言模型的财税训练数据处理方法及系统”的专利,公开号CN120030342A,申请日期为2024年12月。

专利摘要显示,本发明公开了一种用于大语言模型的财税训练数据处理方法及系统,包括:对用于财税训练的财税数据进行采集,以获取原始财税数据;对所述原始财税数据进行数据预处理,并对数据预处理后得到的财税处理数据进行探查,以多维度的对财税处理数据进行打标分类,以获取财税标签数据;根据训练任务的类型的不同,基于所述财税标签数据进行初始训练数据的构建;对所述初始训练数据进行质量检测,以获取满足训练需求的用于大语言模型训练的财税训练数据。本发明的方法从数据采集到最后的数据质检,实现全流程的数据构建策略,解决财税行业高质量训练数据难以构建的问题;并通过持续更新的流水线作业,保障大模型的训练数据紧跟财税法规政策变化情况,避免产生过时的判断及回复。

天眼查资料显示,航天信息股份有限公司,成立于2000年,位于北京市,是一家以从事电信、广播电视和卫星传输服务为主的企业。企业注册资本186285.1248万人民币。通过天眼查大数据分析,航天信息股份有限公司共对外投资了92家企业,参与招投标项目4427次,财产线索方面有商标信息220条,专利信息4466条,此外企业还拥有行政许可20个。

来源:金融界

相关推荐