刚刚学习了卷积神经网络的一些基础知识,现在想要复习之前学过的,再熟悉新知识,练习pytorch编程的能力。首先自制蚂蚁数据集,其次定义只有一层卷积层的神经网络,喂入数据,前向传播得到输出,并使用tensorboard绘图,显示处理前的图像以及处理后的图像,体验卷积的效果。
单独的卷积层(无偏置)是如何对图片进行操作的? 卷积核覆盖到图片上,重合部分对应数字相乘,然后相加,得到输出图像的一个像素点,随后移动相应步长,重复上述操作。 对于多通道图像+多卷积核做卷积: 对于每个卷积核,先在输入3个通道分别作卷积,再将3个通道结果加起来得到卷积输出。所以对于某个卷积层,无论输入图像有多少个通道,输出图像通道数总是等于卷积核数量!
代码解释见注释:
#import一系列依赖库
import torch
from PIL import Image
from tensorboardX import SummaryWriter
from torch import nn
from torch.utils.data import Dataset, DataLoader
import os
from torchvision import transforms
import torch.nn.functional as F
#定义的transforms对象,后面对图像进行变换时使用
#神经网络要求喂入的数据格式是tensor
#trans将PIL格式的image转化成为tensor格式的image
trans=transforms.ToTensor()
#神经网络要求喂入的数据图像大小一致
#我们./dataset/train/ants文件夹下
#图像大小不一致,需要将尺寸一致调为[3,375,500]
trans_re=transforms.Resize([375,500])
#首先创建自己的数据集
#我们的数据是存放在"./dataset/train/ants"下的蚂蚁照片
#定义自己的数据集类
class MyDataset(Dataset):
def __init__(self,root_dir,label_dir):
self.root_dir=root_dir
self.label_dir=label_dir
self.path=os.path.join(self.root_dir,self.label_dir)
self.img_list=os.listdir(self.path)
def __getitem__(self, item):
#通过索引获取图片名称
img_name=self.img_list[item]
#拼接得到图像路径
img_path=os.path.join(self.path,img_name)
#打开图片,得到的图片格式是PIL格式的
img=Image.open(img_path)
#transforms的resize对象
#要求输入为PIL格式,因此首先改变图像大小
img=trans_re(img)
#将图片转变为tensor格式
img=trans(img)
label=self.label_dir
#返回一对(数据,标签)
return img,label
def __len__(self):
return len(self.img_list)
#实例化数据集对象,传入路径
#得到数据集
mydataset=MyDataset('dataset/train','ants')
#dataloader将数据集分为
#一个一个batch,便于喂入神经网络
#这里的batch大小为16
dataloader=DataLoader(dataset=mydataset,batch_size=16)
#定义神经网络类
class MyModel(nn.Module):
def __init__(self):
super(MyModel, self).__init__()
#添加卷积层,输入3通道图像
#输出3通道图像,卷积核大小为3*3
#上下步长为1,四周增加padding为1
self.conv=torch.nn.Conv2d(3,3,(3,3),padding=1)
#前向传播函数
def forward(self,x):
#输入数据通过卷积,并使用relu激活函数
#返回输出的数据
return F.relu(self.conv(x))
#创建神经网络对象
model=MyModel()
#日志存入./test文件夹
writer=SummaryWriter('./test')
#tensorboard可以将多个图像
#组合在一起输出,分为多个step(0,1,2,...)
#便于得知训练中每个阶段网络的输出
step=0
#遍历dataloader中的batch
#分batch喂入数据集
for data in dataloader:
#获取一组图像,一组标签
#我们这里只对图像进行处理观察效果
#实际上label无用
imgs,label=data
#图像经过神经网络处理得到输出
output=model(imgs)
#绘制处理之前的图像,每16(batch_size)张一组
writer.add_images('原图',imgs,step)
##绘制处理之后的图像,每16(batch_size)张一组
writer.add_images('后来',output,step)
#step递增
step=step+1
卷积效果(tensorboard):