中国联通申请扩散模型的训练方法专利,能优化模型训练总损失值的计算

摘要:国家知识产权局信息显示,中国联合网络通信集团有限公司申请一项名为“扩散模型的训练方法、装置、设备及存储介质”的专利,公开号CN 119168907 A,申请日期为2024年10月。

金融界2024年12月24日消息,国家知识产权局信息显示,中国联合网络通信集团有限公司申请一项名为“扩散模型的训练方法、装置、设备及存储介质”的专利,公开号CN 119168907 A,申请日期为2024年10月。

专利摘要显示,本申请提供一种扩散模型的训练方法、装置、设备及存储介质。在0至T中随机选取时间步i,将时间步i和时间步i对应的加噪样本数据xi输入扩散模型得到预测噪音∈′;在0至i中随机选取时间步j,将时间步j和时间步j对应的降噪样本数据xj′输入扩散模型得到预测噪音∈j′;根据加噪样本数据xi和预测噪音∈′、降噪样本数据xj′和预测噪音∈j′,计算得到从时间步i到时间步0的第一重建误差dist[i]和从时间步j到时间步0的第二重建误差dist[j];根据预测噪音∈′、真实噪音∈、第一重建误差dist[i]、第二重建误差dist[j]得到总损失值;根据总损失值进行反向传播更新模型参数;重复执行上述步骤,直至迭代训练结束,得到训练好的扩散模型。

来源:金融界

相关推荐