PyTorch Handbook

5分钟

更新权重

在实践中最简单的权重更新规则是随机梯度下降（SGD）：

``weight = weight - learning_rate * gradient``

我们可以使用简单的Python代码实现这个规则：

learning_rate = 0.01
for f in net.parameters():
    f.data.sub_(f.grad.data * learning_rate)

但是当使用神经网络是想要使用各种不同的更新规则时，比如SGD、Nesterov-SGD、Adam、RMSPROP等，PyTorch中构建了一个包torch.optim实现了所有的这些规则。使用它们非常简单：

In [11]:

import torch.optim as optim

# create your optimizer
optimizer = optim.SGD(net.parameters(), lr=0.01)

# in your training loop:
optimizer.zero_grad()   # zero the gradient buffers
output = net(input)
loss = criterion(output, target)
loss.backward()
optimizer.step()    # Does the update

.. 注意::

观察如何使用``optimizer.zero_grad()``手动将梯度缓冲区设置为零。这是因为梯度是按Backprop部分中的说明累积的。

In [ ]:

上一节: 反向传播下一节: 训练一个分类器

目录

评价

推荐

1. PyTorch 简介

PyTorch的由来

Torch是什么？

重新介绍 PyTorch

对比PyTorch和Tensorflow

再次总结

2. PyTorch 环境搭建

Pytorch环境搭建

安装Pytorch

配置 Jupyter Notebook

测试

问题1：启动python提示编码错误

问题2 默认目录设置不起效

3. PyTorch 深度学习:60分钟快速入门 （官方）

PyTorch 深度学习:60分钟快速入门 （官方）

目录

说明

PyTorch是什么?

开始

NumPy 转换

CUDA 张量

Autograd: 自动求导机制

张量（Tensor）

梯度

Neural Networks

定义网络

损失函数

反向传播

更新权重

训练一个分类器

关于数据？

训练一个图像分类器

读取和归一化 CIFAR10

定义一个卷积神经网络

定义损失函数和优化器

训练网路

在测试集上测试网络

在GPU上训练

多GPU训练

下一步？

数据并行（选读）

导入和参数

虚拟数据集

简单模型

创建一个模型和数据并行

运行模型

结果

总结

4. PyTorch 基础

PyTorch 基础 : 张量

张量(Tensor)

基本类型

Numpy转换

设备间转换

初始化

常用方法

使用PyTorch计算梯度数值

Autograd

简单的自动求导

复杂的自动求导

Autograd 过程解析

扩展Autograd

PyTorch 基础 : 神经网络包nn和优化器optm

定义一个网络

损失函数

优化器

PyTorch 基础 :数据的加载和预处理

Dataset

Dataloader

torchvision 包

torchvision.datasets

torchvision.models

torchvision.transforms

5. 深度学习基础及数学原理

深度学习基础及数学原理

监督学习和无监督学习

3. PyTorch 深度学习:60分钟快速入门（官方）

PyTorch 深度学习:60分钟快速入门（官方）

线性回归（Linear Regreesion）