前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >卷积神经网络入门(一)

卷积神经网络入门(一)

作者头像
月梦@剑心
发布2022-09-14 14:05:14
2040
发布2022-09-14 14:05:14
举报
文章被收录于专栏:月梦·剑心的技术专栏

刚刚学习了卷积神经网络的一些基础知识,现在想要复习之前学过的,再熟悉新知识,练习pytorch编程的能力。首先自制蚂蚁数据集,其次定义只有一层卷积层的神经网络,喂入数据,前向传播得到输出,并使用tensorboard绘图,显示处理前的图像以及处理后的图像,体验卷积的效果。

单独的卷积层(无偏置)是如何对图片进行操作的? 卷积核覆盖到图片上,重合部分对应数字相乘,然后相加,得到输出图像的一个像素点,随后移动相应步长,重复上述操作。 对于多通道图像+多卷积核做卷积: 对于每个卷积核,先在输入3个通道分别作卷积,再将3个通道结果加起来得到卷积输出。所以对于某个卷积层,无论输入图像有多少个通道,输出图像通道数总是等于卷积核数量!

代码解释见注释:

代码语言:javascript
复制
#import一系列依赖库
import torch
from PIL import Image
from tensorboardX import SummaryWriter
from torch import nn
from torch.utils.data import Dataset, DataLoader
import os
from torchvision import transforms
import torch.nn.functional as F

#定义的transforms对象,后面对图像进行变换时使用
#神经网络要求喂入的数据格式是tensor
#trans将PIL格式的image转化成为tensor格式的image
trans=transforms.ToTensor()
#神经网络要求喂入的数据图像大小一致
#我们./dataset/train/ants文件夹下
#图像大小不一致,需要将尺寸一致调为[3,375,500]
trans_re=transforms.Resize([375,500])
#首先创建自己的数据集
#我们的数据是存放在"./dataset/train/ants"下的蚂蚁照片
#定义自己的数据集类
class MyDataset(Dataset):
    def __init__(self,root_dir,label_dir):
        self.root_dir=root_dir
        self.label_dir=label_dir
        self.path=os.path.join(self.root_dir,self.label_dir)
        self.img_list=os.listdir(self.path)
    def __getitem__(self, item):
        #通过索引获取图片名称
        img_name=self.img_list[item]
        #拼接得到图像路径
        img_path=os.path.join(self.path,img_name)
        #打开图片,得到的图片格式是PIL格式的
        img=Image.open(img_path)
        #transforms的resize对象
        #要求输入为PIL格式,因此首先改变图像大小
        img=trans_re(img)
        #将图片转变为tensor格式
        img=trans(img)
        label=self.label_dir
        #返回一对(数据,标签)
        return img,label
    def __len__(self):
        return len(self.img_list)
#实例化数据集对象,传入路径
#得到数据集
mydataset=MyDataset('dataset/train','ants')
#dataloader将数据集分为
#一个一个batch,便于喂入神经网络
#这里的batch大小为16
dataloader=DataLoader(dataset=mydataset,batch_size=16)

#定义神经网络类
class MyModel(nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()
        #添加卷积层,输入3通道图像
        #输出3通道图像,卷积核大小为3*3
        #上下步长为1,四周增加padding为1
        self.conv=torch.nn.Conv2d(3,3,(3,3),padding=1)
    #前向传播函数
    def forward(self,x):
        #输入数据通过卷积,并使用relu激活函数
        #返回输出的数据
        return F.relu(self.conv(x))

#创建神经网络对象
model=MyModel()
#日志存入./test文件夹
writer=SummaryWriter('./test')
#tensorboard可以将多个图像
#组合在一起输出,分为多个step(0,1,2,...)
#便于得知训练中每个阶段网络的输出
step=0
#遍历dataloader中的batch
#分batch喂入数据集
for data in dataloader:
    #获取一组图像,一组标签
    #我们这里只对图像进行处理观察效果
    #实际上label无用
    imgs,label=data
    #图像经过神经网络处理得到输出
    output=model(imgs)
    #绘制处理之前的图像,每16(batch_size)张一组
    writer.add_images('原图',imgs,step)
    ##绘制处理之后的图像,每16(batch_size)张一组
    writer.add_images('后来',output,step)
    #step递增
    step=step+1

卷积效果(tensorboard):

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022-02-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档