PyTorch Handbook

13分钟

定义网络

In [1]:

%matplotlib inline

开始定义一个网络：

In [1]:

import torch
import torch.nn as nn
import torch.nn.functional as F


class Net(nn.Module):

    def __init__(self):
        super(Net, self).__init__()
        # 1 input image channel, 6 output channels, 5x5 square convolution
        # kernel
        self.conv1 = nn.Conv2d(1, 6, 5)
        self.conv2 = nn.Conv2d(6, 16, 5)
        # an affine operation: y = Wx + b
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        # Max pooling over a (2, 2) window
        x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2))
        # If the size is a square you can only specify a single number
        x = F.max_pool2d(F.relu(self.conv2(x)), 2)
        x = x.view(-1, self.num_flat_features(x))
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

    def num_flat_features(self, x):
        size = x.size()[1:]  # all dimensions except the batch dimension
        num_features = 1
        for s in size:
            num_features *= s
        return num_features


net = Net()
print(net)

Net( (conv1): Conv2d(1, 6, kernel_size=(5, 5), stride=(1, 1)) (conv2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1)) (fc1): Linear(in_features=400, out_features=120, bias=True) (fc2): Linear(in_features=120, out_features=84, bias=True) (fc3): Linear(in_features=84, out_features=10, bias=True) )

在模型中必须要定义 forward 函数，backward 函数（用来计算梯度）会被autograd自动创建。可以在 forward 函数中使用任何针对 Tensor 的操作。

net.parameters()返回可被学习的参数（权重）列表和值

In [2]:

params = list(net.parameters())
print(len(params))
print(params[0].size())  # conv1's .weight

10 torch.Size([6, 1, 5, 5])

测试随机输入32×32。注：这个网络（LeNet）期望的输入大小是32×32，如果使用MNIST数据集来训练这个网络，请把图片大小重新调整到32×32。

In [6]:

input = torch.randn(1, 1, 32, 32)
out = net(input)
print(out)

tensor([[ 0.1120, 0.0713, 0.1014, -0.0696, -0.1210, 0.0084, -0.0206, 0.1366, -0.0455, -0.0036]], grad_fn=<AddmmBackward>)

将所有参数的梯度缓存清零，然后进行随机梯度的的反向传播：

In [7]:

net.zero_grad()
out.backward(torch.randn(1, 10))

Note
``torch.nn`` 只支持小批量输入。整个 ``torch.nn`` 包都只支持小批量样本，而不支持单个样本。例如，``nn.Conv2d`` 接受一个4维的张量， ``每一维分别是sSamples * nChannels * Height * Width（样本数*通道数*高*宽）``。如果你有单个样本，只需使用 ``input.unsqueeze(0)`` 来添加其它的维数

在继续之前，我们回顾一下到目前为止用到的类。

回顾:

torch.Tensor：一个用过自动调用 backward()实现支持自动梯度计算的 多维数组 ，并且保存关于这个向量的梯度 w.r.t.
nn.Module：神经网络模块。封装参数、移动到GPU上运行、导出、加载等。
nn.Parameter：一种变量，当把它赋值给一个Module时，被自动地注册为一个参数。
autograd.Function：实现一个自动求导操作的前向和反向定义，每个变量操作至少创建一个函数节点，每一个Tensor的操作都回创建一个接到创建Tensor和 编码其历史 的函数的Function节点。

重点如下：

定义一个网络
处理输入，调用backword

还剩：

计算损失
更新网络权重

上一节: Neural Networks 下一节: 损失函数

目录

评价

推荐

1. PyTorch 简介

PyTorch的由来

Torch是什么？

重新介绍 PyTorch

对比PyTorch和Tensorflow

再次总结

2. PyTorch 环境搭建

Pytorch环境搭建

安装Pytorch

配置 Jupyter Notebook

测试

问题1：启动python提示编码错误

问题2 默认目录设置不起效

3. PyTorch 深度学习:60分钟快速入门 （官方）

PyTorch 深度学习:60分钟快速入门 （官方）

目录

说明

PyTorch是什么?

开始

NumPy 转换

CUDA 张量

Autograd: 自动求导机制

张量（Tensor）

梯度

Neural Networks

定义网络

损失函数

反向传播

更新权重

训练一个分类器

关于数据？

训练一个图像分类器

读取和归一化 CIFAR10

定义一个卷积神经网络

定义损失函数和优化器

训练网路

在测试集上测试网络

在GPU上训练

多GPU训练

下一步？

数据并行（选读）

导入和参数

虚拟数据集

简单模型

创建一个模型和数据并行

运行模型

结果

总结

4. PyTorch 基础

PyTorch 基础 : 张量

张量(Tensor)

基本类型

Numpy转换

设备间转换

初始化

常用方法

使用PyTorch计算梯度数值

Autograd

简单的自动求导

复杂的自动求导

Autograd 过程解析

扩展Autograd

PyTorch 基础 : 神经网络包nn和优化器optm

定义一个网络

损失函数

优化器

PyTorch 基础 :数据的加载和预处理

Dataset

Dataloader

torchvision 包

torchvision.datasets

torchvision.models

torchvision.transforms

5. 深度学习基础及数学原理

深度学习基础及数学原理

监督学习和无监督学习

3. PyTorch 深度学习:60分钟快速入门（官方）

PyTorch 深度学习:60分钟快速入门（官方）

线性回归（Linear Regreesion）