摘要:金融界 2025 年 4 月 22 日消息,国家知识产权局信息显示,中国联合网络通信集团有限公司;联通数字科技有限公司申请一项名为“预训练数据的清洗的方法、装置、电子设备及存储介质”的专利,公开号 CN119848429A,申请日期为 2024 年 12 月。
金融界 2025 年 4 月 22 日消息,国家知识产权局信息显示,中国联合网络通信集团有限公司;联通数字科技有限公司申请一项名为“预训练数据的清洗的方法、装置、电子设备及存储介质”的专利,公开号 CN119848429A,申请日期为 2024 年 12 月。
专利摘要显示,本申请提供一种预训练数据的清洗的方法、装置、电子设备及存储介质。该方法包括:确定多进程中的处于空闲态的目标进程;为目标进程分配单批次处理条数的预训练数据,其中,单批次处理条数是根据并行进程数和预训练数据集包含的预训练数据总条数确定的;通过目标进程对分配的预训练数据进行数据清洗处理,得到目标数据;其中,数据清洗处理包括条件过滤处理以及去重处理;当预训练数据集清洗完毕,根据每个数据批次内对应的目标数据,得到预训练数据集对应的清洗后数据集。
天眼查资料显示,中国联合网络通信集团有限公司,成立于1994年,位于北京市,是一家以从事电信、广播电视和卫星传输服务为主的企业。企业注册资本10481551.957532万人民币。通过天眼查大数据分析,中国联合网络通信集团有限公司共对外投资了34家企业,参与招投标项目3072次,财产线索方面有商标信息3664条,专利信息5000条,此外企业还拥有行政许可11个。
联通数字科技有限公司,成立于2006年,位于北京市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本968983.091327万人民币。通过天眼查大数据分析,联通数字科技有限公司共对外投资了54家企业,参与招投标项目5000次,财产线索方面有商标信息24条,专利信息1733条,此外企业还拥有行政许可41个。
来源:金融界