针对matlab版本的卷积神经网络的最终分类器(输出部分)的理解: 部分代码:
'''cnnff'''
net.fv = []; % 把最后一层得到的特征map拉成一条向量,作为最终提取到的特征向量
for j = 1 : numel(net.layers{n-1}.a) % 最后一层的特征map的个数
sa = size(net.layers{n-1}.a{j}); %得到几行几列的数
% 将所有的特征map拉成一条列向量。还有一维就是对应的样本索引。每个样本一列,每列为对应的特征向量
net.fv = [net.fv; reshape(net.layers{n-1}.a{j}, sa(1) * sa(2), sa(3))];
end;
% feedforward into output perceptrons
if strcmp(net.layers{n}.objective, 'sigm')
% 计算网络的最终输出值
net.o = sigm(net.ffW * net.fv + repmat(net.ffb, 1, size(net.fv, 2)));
'''cnntest'''
net = cnnff(net, x); %前向传播得到输出
% [Y,I] = max(X) returns the indices of the maximum values in vector I
[~, h] = max(net.o); % 找到最大的输出对应的标签
[~, a] = max(y); % 找到最大的期望输出对应的索引
bad = find(h ~= a); % 找到他们不相同的个数,也就是错误的次数
er = numel(bad) / size(y, 2);
拿MNIST手写体的十种分类来举例, 单纯的提取出CNN输出特征向量的最大值在向量里的位置,位置对应于10个数字0~9 如向量L1=[0 0.9 0.1 0.2 0 0 0 0 0 0 ], 0.9最大,在第二个位置,分类到数字1的类中。 如向量L2=[0 0.5 0.1 0.2 0 0 0 0 0 0.8 ], 0.8最大,在第十个位置,分类到数字9的类中。 说明:为什么第二个位置就代表数字1这一类呢,这和标签有关,这里面标签的设定不是1,2,3,4,5…;而是[1,0,0,0,…],1代表表示哪一类。 当然也可以进行其他分类器设计,CNN的主要任务是进行特征提取,对应分类器设计没有要求。