航天信息申请基于大语言模型的数据清洗专利,提高数据清洗效率

360影视 欧美动漫 2025-05-19 17:21 2

摘要:国家知识产权局信息显示,航天信息股份有限公司申请一项名为“一种基于大语言模型的数据清洗方法及系统”的专利,公开号CN119988832A,申请日期为2024年12月。

金融界2025年5月19日消息,国家知识产权局信息显示,航天信息股份有限公司申请一项名为“一种基于大语言模型的数据清洗方法及系统”的专利,公开号CN119988832A,申请日期为2024年12月。

专利摘要显示,本发明公开了一种基于大语言模型的数据清洗方法及系统,包括:收集和整理待清洗的数据集,格式化为适合模型处理的文本格式,获得待清洗文本数据;基于大语言模型对待清洗文本数据进行文本纠错和规范化处理,基于大语言模型对待清洗文本数据进行异常处理,基于大语言模型对待清洗文本数据进行实体识别和标准化处理;基于大语言模型对待清洗文本数据进行语义一致性检查,基于大语言模型对待清洗文本数据进行缺失数据生成,基于大语言模型对待清洗文本数据进行重复数据处理;记录基于大语言模型对待清洗文本数据进行清洗过程中的所有问题、实施的处理措施、生成的结果以及过程中的各种参数,并基于所述记录,生成结构化报告。

天眼查资料显示,航天信息股份有限公司,成立于2000年,位于北京市,是一家以从事电信、广播电视和卫星传输服务为主的企业。企业注册资本186285.1248万人民币。通过天眼查大数据分析,航天信息股份有限公司共对外投资了91家企业,参与招投标项目4421次,财产线索方面有商标信息219条,专利信息4450条,此外企业还拥有行政许可20个。

来源:金融界

相关推荐