神经网络模型是由神经网络层和Tensor操作构成的,mindspore.nn提供了常见神经网络层的实现。在MindSpore中,使用Cell类构建所有网络,它是网络的基本单元。一个神经网络模型表示为一个Cell,由不同的子Cell构成。通过这样的嵌套结构,可以简单地使用面向对象编程的思维对神经网络结构进行构建和管理。
%%capture captured_output
# 实验环境已经预装了mindspore==2.2.14,如需更换mindspore版本,可更改下面mindspore的版本号
!pip uninstall mindspore -y
!pip install -i https://pypi.mirrors.ustc.edu.cn/simple mindspore==2.2.14
import mindspore
from mindspore import nn, ops
当我们定义神经网络时,可以继承nn.Cell
类,在__init__
方法中进行子Cell的实例化和状态管理,在construct
方法中实现Tensor操作。
我们可以通过输入数据直接调用模型,得到一个包含每个类别原始预测值的十维Tensor输出。
本节中我们分解上节构造的神经网络模型中的每一层。首先我们构造一个shape为(3, 28, 28)的随机数据(3个28x28的图像),依次通过每一个神经网络层来观察其效果。
input_image = ops.ones((3, 28, 28), mindspore.float32)
print(input_image.shape)
实例化nn.Flatten层,将28x28的2D张量转换为784大小的连续数组。
nn.Dense为全连接层,其使用权重和偏差对输入进行线性变换。
nn.ReLU层给网络中加入非线性的激活函数,帮助神经网络学习各种复杂的特征。
nn.SequentialCell是一个有序的Cell容器。输入Tensor将按照定义的顺序通过所有Cell。我们可以使用SequentialCell
来快速组合构造一个神经网络模型。
最后使用nn.Softmax将神经网络最后一个全连接层返回的logits的值缩放为[0, 1],表示每个类别的预测概率。axis
指定的维度数值和为1。
softmax = nn.Softmax(axis=1)
pred_probab = softmax(logits)
网络内部神经网络层具有权重参数和偏置参数(如nn.Dense
),这些参数会在训练过程中不断进行优化,可通过 model.parameters_and_names()
来获取参数名及对应的参数详情。
这节主要使用MindSpore框架构建简单的神经网络模型。首先介绍了继承nn.Cell类定义模型类的方法,在__init__和construct方法中实现网络结构。然后详细介绍了使用nn.Flatten、nn.Dense、nn.ReLU等内置层组建网络,并演示了如何利用nn.SequentialCell快速组合模型。此外,文章还展示了如何使用nn.Softmax计算模型的预测概率输出,并讲解了如何查看和获取模型的参数信息。总的来说,这篇文章为读者提供了使用MindSpore构建神经网络模型的基本思路和方法。