卷积神经网络入门(一)

月梦@剑心

发布于 2022-09-14 14:05:14

2040

发布于 2022-09-14 14:05:14

刚刚学习了卷积神经网络的一些基础知识，现在想要复习之前学过的，再熟悉新知识，练习pytorch编程的能力。首先自制蚂蚁数据集，其次定义只有一层卷积层的神经网络，喂入数据，前向传播得到输出，并使用tensorboard绘图，显示处理前的图像以及处理后的图像，体验卷积的效果。

单独的卷积层(无偏置)是如何对图片进行操作的？ 卷积核覆盖到图片上，重合部分对应数字相乘，然后相加，得到输出图像的一个像素点，随后移动相应步长，重复上述操作。 对于多通道图像+多卷积核做卷积： 对于每个卷积核，先在输入3个通道分别作卷积，再将3个通道结果加起来得到卷积输出。所以对于某个卷积层，无论输入图像有多少个通道，输出图像通道数总是等于卷积核数量！

代码解释见注释：

#import一系列依赖库
import torch
from PIL import Image
from tensorboardX import SummaryWriter
from torch import nn
from torch.utils.data import Dataset, DataLoader
import os
from torchvision import transforms
import torch.nn.functional as F

#定义的transforms对象，后面对图像进行变换时使用
#神经网络要求喂入的数据格式是tensor
#trans将PIL格式的image转化成为tensor格式的image
trans=transforms.ToTensor()
#神经网络要求喂入的数据图像大小一致
#我们./dataset/train/ants文件夹下
#图像大小不一致，需要将尺寸一致调为[3,375,500]
trans_re=transforms.Resize([375,500])
#首先创建自己的数据集
#我们的数据是存放在"./dataset/train/ants"下的蚂蚁照片
#定义自己的数据集类
class MyDataset(Dataset):
    def __init__(self,root_dir,label_dir):
        self.root_dir=root_dir
        self.label_dir=label_dir
        self.path=os.path.join(self.root_dir,self.label_dir)
        self.img_list=os.listdir(self.path)
    def __getitem__(self, item):
        #通过索引获取图片名称
        img_name=self.img_list[item]
        #拼接得到图像路径
        img_path=os.path.join(self.path,img_name)
        #打开图片，得到的图片格式是PIL格式的
        img=Image.open(img_path)
        #transforms的resize对象
        #要求输入为PIL格式，因此首先改变图像大小
        img=trans_re(img)
        #将图片转变为tensor格式
        img=trans(img)
        label=self.label_dir
        #返回一对(数据，标签)
        return img,label
    def __len__(self):
        return len(self.img_list)
#实例化数据集对象，传入路径
#得到数据集
mydataset=MyDataset('dataset/train','ants')
#dataloader将数据集分为
#一个一个batch，便于喂入神经网络
#这里的batch大小为16
dataloader=DataLoader(dataset=mydataset,batch_size=16)

#定义神经网络类
class MyModel(nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()
        #添加卷积层，输入3通道图像
        #输出3通道图像，卷积核大小为3*3
        #上下步长为1，四周增加padding为1
        self.conv=torch.nn.Conv2d(3,3,(3,3),padding=1)
    #前向传播函数
    def forward(self,x):
        #输入数据通过卷积，并使用relu激活函数
        #返回输出的数据
        return F.relu(self.conv(x))

#创建神经网络对象
model=MyModel()
#日志存入./test文件夹
writer=SummaryWriter('./test')
#tensorboard可以将多个图像
#组合在一起输出，分为多个step(0,1,2,...)
#便于得知训练中每个阶段网络的输出
step=0
#遍历dataloader中的batch
#分batch喂入数据集
for data in dataloader:
    #获取一组图像，一组标签
    #我们这里只对图像进行处理观察效果
    #实际上label无用
    imgs,label=data
    #图像经过神经网络处理得到输出
    output=model(imgs)
    #绘制处理之前的图像，每16(batch_size)张一组
    writer.add_images('原图',imgs,step)
    ##绘制处理之后的图像，每16(batch_size)张一组
    writer.add_images('后来',output,step)
    #step递增
    step=step+1

卷积效果(tensorboard):