前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Pytorch实现简单的数字识别(下)

Pytorch实现简单的数字识别(下)

作者头像
用户6719124
发布2019-11-18 00:22:44
6780
发布2019-11-18 00:22:44
举报
文章被收录于专栏:python pytorch AI机器学习实践

上次介绍了读取数据和神经网络构建,本节介绍训练和测试代码。

首先将上节代码放入:

代码语言:javascript
复制
import torch
from torch import nn
from torch.nn import functional as F
from torch import optim
import torchvision
import matplotlib.pyplot as plt
from utils import plot_curve, plot_result_image, one_hot
# 从utils.py中导入定义的工具
from torch.utils.data import DataLoader,Dataset
batch_size = 512
# 同时并行处理512张图片
train_loader = torch.utils.data.DataLoader(
    torchvision.datasets.MNIST('mnist data', train=True, download=False,
                               # 更改download=True,以在线下载
                               transform=torchvision.transforms.Compose([
                                   torchvision.transforms.ToTensor(),
                                   # numpy数据转换为Tensor格式
                                   torchvision.transforms.Normalize(
                                       # 正则化
                                       (0.1307,), (0.3081,)
                                       # 设置参数,使数据均匀分布在0,1附近,以方便优化
                                   )
                               ])),
    batch_size=batch_size, shuffle=True
    # shuffle=True:随机打散
)

test_loader = torch.utils.data.DataLoader(
    torchvision.datasets.MNIST('mnist data', train=False, download=False,
                               transform=torchvision.transforms.Compose([
                                   torchvision.transforms.ToTensor(),
                                   torchvision.transforms.Normalize(
                                       (0.1307,), (0.3081,)
                                   )
                               ])),
    batch_size=batch_size, shuffle=True)

# 开始构建神经网络
x, y = next(iter(train_loader))
class Net(nn.Module):

    def __init__(self):
        super(Net, self).__init__()
        # 准备构建三层神经网络,每一层都是xw+b函数
        self.fc1 = nn.Linear(28*28, 256)
        # 构建线性层
        # 初始图片的像素是28*28,默认是从“大层到小层”的过程
        self.fc2 = nn.Linear(256, 64)
        self.fc3 = nn.Linear(64, 10)
        # 由于是十分类问题,因此最终输出是10个

    def forward(self, x):
        # 创建计算过程
        # x:[batch, 1, 28, 28]
        # 本次使用relu作为激活函数
        x = F.relu(self.fc1(x))
        # h1 = relu(xw + b1)
        x = F.relu(self.fc2(x))
        # h2 = relu(h1w2 + b2)
        # h3 = h2w3 + b3
        x = self.fc3(x)
        # 分类问题,可以加入softmax函数
        return x
        # 返回预测值

开始训练部分:

代码语言:javascript
复制
net = Net()
# 创建网络对象net
optimizer = optim.SGD(net.parameters(), lr=0.01, momentum=0.9)
# 选出优化器,learning rate设置为0.01, 动量设置为0.9
# 优化出合适的[w1, b1, w2, b2, w3, b3]

train_loss = []
for epoch in range(3):
# 每次求导都需要更新,因此进行迭代,这里进行三层迭代
    for batch_idx, (x, y) in enumerate(train_loader):
        # 每次迭代会对整个数据循环一遍
        # 这里得到的x的shape为[512, 1, 28, 28]
        # x:[b, 1, 28, 28], y:[512]
        # 实际图片为4维,这里需要将其转化为2维。即将x进行打平, 将[b, 1, 28, 28] ==> [b, feature]
        x = x.view(x.size(0), 28*28)
        out = net(x)
        # 将图片传给x
        y_onehot = one_hot(y)
        # 对y进行one_hot编码
        loss = F.mse_loss(out, y_onehot)
        optimizer.zero_grad()
        # 清零操作
        # 采用均方差计算loss
        loss.backward()
        optimizer.step()
        # 完成w' = w - lr*gradient的过程,更新梯度
    # 迭代三次,训练过程结束后,得到最佳的[w1, b1, w2, b2, w3, b3]
        train_loss.append(loss.item())
        if batch_idx % 10 == 0:
            print(epoch, batch_idx, loss, loss.item())
             # 每隔10个输出结果

这里绘制出降低loss的曲线

代码语言:javascript
复制
plot_curve(train_loss)

结果如下

但要注意loss的降低程度不能代表神经网络结构模型的好坏,应该将最终的正确率结果作为验证模型优劣的工具。

代码语言:javascript
复制
total_correct = 0
# 另初始总正确率为0
for x, y in test_loader:
    x = x.view(x.size(0), 28*28)
    # 打平操作,成28*28
    out = net(x)
    # out : [b, 10]
    pred = out.argmax(dim=1)
    # (1维上)选出可能概率最大的索引作为预测值
    # 即执行[b, 10] ==> [b]的操作
    correct = pred.eq(y).sum().float().item()
    # correct = pred.eq(y)正确的话返回1,后面sum将正确的1集合起来,最后再转换为float和item类型(tensor的转换)
    total_correct += correct
    # 正确的次数加到total_correct上去
total_num = len(test_loader.dataset)
# 计算出整体样本数
acc = total_correct / total_num

加入输出正确率acc的代码

代码语言:javascript
复制
print('acc', acc)

这里输出了正确率为

代码语言:javascript
复制
acc 0.8886

88.86%的正确率,效果尚可。

为更直观的显示出识别结果,加入代码:

代码语言:javascript
复制
x, y = next(iter(test_loader))
# 查看batch的预测结果
out = net(x.view(x.size(0), 28*28))
pred = out.argmax(dim=1)
plot_result_image(x, pred, 'test')
# 直观显示结果

输出一张3*3的识别图片

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-09-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 python pytorch AI机器学习实践 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档