Pytorch实现简单的数字识别（下）

用户6719124

发布于 2019-11-18 00:22:44

6780

发布于 2019-11-18 00:22:44

上次介绍了读取数据和神经网络构建，本节介绍训练和测试代码。

首先将上节代码放入：

import torch
from torch import nn
from torch.nn import functional as F
from torch import optim
import torchvision
import matplotlib.pyplot as plt
from utils import plot_curve, plot_result_image, one_hot
# 从utils.py中导入定义的工具
from torch.utils.data import DataLoader,Dataset
batch_size = 512
# 同时并行处理512张图片
train_loader = torch.utils.data.DataLoader(
    torchvision.datasets.MNIST('mnist data', train=True, download=False,
                               # 更改download=True，以在线下载
                               transform=torchvision.transforms.Compose([
                                   torchvision.transforms.ToTensor(),
                                   # numpy数据转换为Tensor格式
                                   torchvision.transforms.Normalize(
                                       # 正则化
                                       (0.1307,), (0.3081,)
                                       # 设置参数，使数据均匀分布在0,1附近，以方便优化
                                   )
                               ])),
    batch_size=batch_size, shuffle=True
    # shuffle=True：随机打散
)

test_loader = torch.utils.data.DataLoader(
    torchvision.datasets.MNIST('mnist data', train=False, download=False,
                               transform=torchvision.transforms.Compose([
                                   torchvision.transforms.ToTensor(),
                                   torchvision.transforms.Normalize(
                                       (0.1307,), (0.3081,)
                                   )
                               ])),
    batch_size=batch_size, shuffle=True)

# 开始构建神经网络
x, y = next(iter(train_loader))
class Net(nn.Module):

    def __init__(self):
        super(Net, self).__init__()
        # 准备构建三层神经网络，每一层都是xw+b函数
        self.fc1 = nn.Linear(28*28, 256)
        # 构建线性层
        # 初始图片的像素是28*28，默认是从“大层到小层”的过程
        self.fc2 = nn.Linear(256, 64)
        self.fc3 = nn.Linear(64, 10)
        # 由于是十分类问题，因此最终输出是10个

    def forward(self, x):
        # 创建计算过程
        # x:[batch, 1, 28, 28]
        # 本次使用relu作为激活函数
        x = F.relu(self.fc1(x))
        # h1 = relu(xw + b1)
        x = F.relu(self.fc2(x))
        # h2 = relu(h1w2 + b2)
        # h3 = h2w3 + b3
        x = self.fc3(x)
        # 分类问题，可以加入softmax函数
        return x
        # 返回预测值

开始训练部分：

net = Net()
# 创建网络对象net
optimizer = optim.SGD(net.parameters(), lr=0.01, momentum=0.9)
# 选出优化器，learning rate设置为0.01， 动量设置为0.9
# 优化出合适的[w1, b1, w2, b2, w3, b3]

train_loss = []
for epoch in range(3):
# 每次求导都需要更新，因此进行迭代，这里进行三层迭代
    for batch_idx, (x, y) in enumerate(train_loader):
        # 每次迭代会对整个数据循环一遍
        # 这里得到的x的shape为[512, 1, 28, 28]
        # x:[b, 1, 28, 28], y:[512]
        # 实际图片为4维，这里需要将其转化为2维。即将x进行打平， 将[b, 1, 28, 28] ==> [b, feature]
        x = x.view(x.size(0), 28*28)
        out = net(x)
        # 将图片传给x
        y_onehot = one_hot(y)
        # 对y进行one_hot编码
        loss = F.mse_loss(out, y_onehot)
        optimizer.zero_grad()
        # 清零操作
        # 采用均方差计算loss
        loss.backward()
        optimizer.step()
        # 完成w' = w - lr*gradient的过程，更新梯度
    # 迭代三次，训练过程结束后，得到最佳的[w1, b1, w2, b2, w3, b3]
        train_loss.append(loss.item())
        if batch_idx % 10 == 0:
            print(epoch, batch_idx, loss, loss.item())
             # 每隔10个输出结果

这里绘制出降低loss的曲线

plot_curve(train_loss)

结果如下

但要注意loss的降低程度不能代表神经网络结构模型的好坏，应该将最终的正确率结果作为验证模型优劣的工具。

total_correct = 0
# 另初始总正确率为0
for x, y in test_loader:
    x = x.view(x.size(0), 28*28)
    # 打平操作，成28*28
    out = net(x)
    # out : [b, 10]
    pred = out.argmax(dim=1)
    # （1维上）选出可能概率最大的索引作为预测值
    # 即执行[b, 10] ==> [b]的操作
    correct = pred.eq(y).sum().float().item()
    # correct = pred.eq(y)正确的话返回1，后面sum将正确的1集合起来,最后再转换为float和item类型(tensor的转换)
    total_correct += correct
    # 正确的次数加到total_correct上去
total_num = len(test_loader.dataset)
# 计算出整体样本数
acc = total_correct / total_num

加入输出正确率acc的代码

print('acc', acc)

这里输出了正确率为

acc 0.8886

88.86%的正确率，效果尚可。

为更直观的显示出识别结果，加入代码：

x, y = next(iter(test_loader))
# 查看batch的预测结果
out = net(x.view(x.size(0), 28*28))
pred = out.argmax(dim=1)
plot_result_image(x, pred, 'test')
# 直观显示结果

输出一张3*3的识别图片

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2019-09-22，如有侵权请联系 cloudcommunity@tencent.com 删除

神经网络

本文分享自 python pytorch AI机器学习实践微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

神经网络

登录后参与评论

0 条评论

热度

Pytorch实现简单的数字识别（下）

Pytorch实现简单的数字识别（下）

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐