Transforms预处理

360影视 日韩动漫 2025-05-19 22:48 2

摘要:图像预处理的主要目的是消除图像中无关的信息,恢复有用的真实信息,即抑制不想要的变形或者增强某些对于后续处理重要的图像特征。通过增强有关信息的可检测性、最大限度地简化数据,从而改进特征提取、图像分割、匹配和识别的可靠性。预处理不会增加图像的信息量,一般会减少信息

图像预处理的主要目的是消除图像中无关的信息,恢复有用的真实信息,即抑制不想要的变形或者增强某些对于后续处理重要的图像特征。通过增强有关信息的可检测性、最大限度地简化数据,从而改进特征提取、图像分割、匹配和识别的可靠性。预处理不会增加图像的信息量,一般会减少信息量。在pytorch中,图像的预处理过程中常常需要对图片的格式、尺寸等做一系列的变化,这就需要借助transforms。torchvision.transforms模块主要用于对图像进行转换等一系列预处理操作,其主要目的是对图像数据进行增强,进而提高模型的泛化能力。主要包括对 Tensor 及 PIL Image 对象的操作,例如随机切割、旋转、数据类型转换等。所有TorchVision数据集都有两个参数——用于修改要素的transform和用于修改标注的target _ transform。它们接受包含变换逻辑的调用。torchvision.transforms模块提供了一些现成的常用转换。FashionMNIST特征是PIL图像格式,标签是整数。对于训练,我们需要归一化张量形式的特征,以及one-hot编码张量形式的标签。为了进行这些转换,我们使用ToTensor和Lambda。

ToTensor将PIL图像或数字数组转换为浮点型。并将图像的像素亮度值缩放到范围[0., 1.]

transforms.ToTensor的作用是将一个PIL Image格式的图片或者是取值范围为[0,255],形状为[H×W×C]的numpy.ndarray的数组转换为取值范围为[0.0,1.0],形状为[C×H×W]的tensor格式图片

Lambda转换应用任何用户定义的lambda函数。这里,我们定义了一个函数,将整数转换成one-hot张量。它首先创建一个大小为10(我们数据集中标签的数量)的零张量,并调用scatter_在标签y给出的索引上赋值=1。

import torchfrom torchvision import datasetsfrom torchvision.transforms import ToTensor, Lambdadef test_demo:test = datasets.FashionMNIST(root="data",train=True,download=True,transform=ToTensor,target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1)))#lambda表达式,输入一个y,创建一个torch,10的zeros,进行原地的scatter,在0个维度,y个位置数据设置value为1t = test[0]#输出代表了张量形式的特征,one hot张量形式的标签print(t)if __name__ == '__main__':test_demo

来源:煜城教育

相关推荐