PyTorch由于使用了强大的GPU加速的Tensor计算(类似numpy)和基于磁带的自动系统的深度神经网络。这使得今年一月份被开源的PyTorch成为了深度学习领域新流行框架,许多新的论文在发表过程中都加入了大多数人不理解的PyTorch代码。这篇文章我们就来讲述一下我对PyTorch代码的理解,希望能帮助你阅读PyTorch代码。整个过程是基于贾斯汀·的约翰逊伟大教程。如果你想了解更多或者有超过10分钟的时间,建议你去读下整篇代码。
PyTorch 由4个主要包装组成:
1. 导入工具
可以你这样导入PyTorch:
2.torch数组取代了numpy ndarray - >在GPU支持下提供线性代数
第一个特色,PyTorch提供了一个像numpy的数组一样的多维数组,当数据类型被转换为(torch.cuda.TensorFloat)时,可以在GPU上进行处理。这个数组和它的关联函数是一般的科学计算工具。
从下面的代码中,我们可以发现,PyTorch提供的这个包的功能可以将我们常用的二维数组变成GPU可以处理的三维数组。这极大的提高了GPU的利用效率,提升了计算速度。
大家可以自己比较Torch和numpy,从而发现他们的优缺点。
3.torch.autograd 可以生成一个计算图- > 自动计算梯度
第二个特色是autograd 包,其提供了定义计算图的能力,以便我们可以自动计算渐变梯度。在计算图中,一个节点是一个数组,边(边缘)是对数组的一个操作。要做一个计算图,我们需要在(torch.aurograd.Variable ())函数中通过包装数组来创建一个节点。那么我们在这个节点上所做的所有操作都将被定义为边,它们将是计算图中新的节点。图中的每个节点都有一个(node.data )属性,它是一个多维数组和一个(node.grad )属性,这是相对于一些标量值的渐变(node.grad也是一个。变量())在定义计算图之后,我们可以使用单个命令(loss.backward ())来计算图中所有节点的损耗梯度。
4.Tronch.nn 包含各种NN 层(张量行的线性映射)+ (非线性) - >
其作用是有助于构建神经网络计算图,而无需手动操纵张量和参数,减少不必要的麻烦。
第三个特色是高级神经网络库(torch.nn ),其抽象出了神经网络层中的所有参数处理,以便于在通过几个命令(例如torch.nn.conv )就很容易地定义NN 。这个包也带有流动的损失函数的功能(例如torch.nn.MSEloss )。我们首先定义一个模型容器,例如使用(torch.nn.Sequential )的层序列的模型,然后在序列中列出我们期望的这个高级神经网络库也可以处理其他的事情,我们可以使用(model.parameters ())访问参数(Variable())
我们还可以通过子类(torch.nn.Module )定义自定义层,并实现接受(Variable ())作为输入的(forward ())函数,并产生(Variable ())作为输出我们也可以通过定义一个时间变化的层来做一个动态网络。
5.torch.optim 也可以做优化- >
我们使用torch.nn 构建一个神经网络计算图,使用torch.autograd 来计算梯度,然后将它们提供给torch.optim 来更新网络参数。
第四个特色是与NN 库一起工作的优化软件包(torch.optim )。该库包含复杂的优化器,如Adam ,RMSprop 等。我们定义一个优化器并传递网络参数和学习率(opt = torch .optim.Adam (model.parameters (),lr = learning_rate ))然后我们调用(opt.step())对我们的参数进行近一步更新。
建立神经网络很容易,但是如何协同工作并不容易这是一个示例显示如何协同工作:
希望上述的介绍能够帮你更好的阅读PyTorch代码。