感知机的对偶形式「建议收藏」

全栈程序员站长

发布于 2022-11-01 14:58:13

3550

发布于 2022-11-01 14:58:13

大家好，又见面了，我是你们的朋友全栈君

首先声明感知机的对偶形式与原始形式并没有多大的区别，运算的过程都是一样的，但通过对偶形式会事先计算好一些步骤的结果并存储到Gray矩阵中，因此可以加快一些运算速度，数据越多节省的计算次数就越多，因此比原始形式更加的优化。首先我们介绍一下感知机的原始形式，之后与其对比。

感知机

感知机是二类分类的线性分类模型，输入为实例的特征向量，输出为实例的类别，分别去+1和-1两值。感知机对应与输入空间中将实例划分为正负两类的分离超平面，属于判别模型。感知机学习旨在求出能将训练数据划分的分离超平面，其学习算法为，基于误分类的损失函数利用随机梯度下降法对损失函数进行极小化求解出超平面。

感知机学习算法是对以下问题优化，给定一个训练数据集 T={(x1,y1),(x2,y2),(x3,y3),…,(xN)(yN)} 其中，xi∈X=R^N , yi∈Y={-1,1},i=1,2,…,N,求参数w,b，使其为以下损失函数极小化问题的解。

其中M为误分类点的集合。感知机学习算法，具体采用随机梯度下降法（与梯度下降法每次迭代的是全局所有点不同，随机梯度下降每次只取一个点，虽然每次下降的方向不一定准确，但经过多次迭代，一定会接近最优值）损失函数L(w,b)的梯度由

给出，其中M是固定的误分类点的集合。随机选取一个误分类点（xi,yi），对w,b进行更新：

其中η（0<η<=1）是步长，统计学习中称为学习率，通过这样不断的迭代期待损失函数L（w,b）不断减小，直到为0.

总结下其基本原始算法步骤如下：

输入：训练数据集

其中

输出：w,b ; 感知机模型 f(x)=sign(w·x+b). (1) 选取初值 w0 , b0 (2) 在训练集中选取数据（xi,yi） (3) 如果 yi(w·xi+b)<=0

(4) 转至步骤（2）,直至训练集没有误分类点. 例1（原始形式方式）：如图1训练数据集，其正实例点是 x1=(3,3)^T, x2=(4,3)^T ,负实例点是x3=(1,1)^T，求感知机模型f(x)=sign(w · x + b). 这里w=( w(1),w(2) )^T,x=( x(1),x(2) )^T