前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >[吴恩达机器学习笔记]12支持向量机5SVM参数细节

[吴恩达机器学习笔记]12支持向量机5SVM参数细节

作者头像
演化计算与人工智能
发布2020-08-14 14:51:41
3530
发布2020-08-14 14:51:41
举报

12.5 SVM 参数细节

标记点选取

  1. 标记点(landmark)如图所示为
l^{(1)},l^{(2)},l^{(3)}

,设核函数为 高斯函数 ,其中设预测函数 y=1 if

\theta_0+\theta_{1}f_1+\theta_{2}f_2+\theta_{3}f_3\ge0
  1. 在实际中需要用 很多标记点 ,那么如何选取 标记点(landmark)即使用训练集中的样本作为标记点 ,假设有一个样本为
x^{(1)}

,则在相同的位置可以设置标记点

l^{(1)}

, 此时可以得到 m 个标记点与训练集中样本数一致,且每一个标记点的位置都与每一个样本的位置一致。 因为这说明特征函数基本上是在描述每一个样本距离与样本集中其他样本的距离

  1. 样本集(不仅仅是训练集,而是所有样本) 中的样本作为标记点.
  1. 然后使用 相似度 函数计算 每个样本和标记点之间的特征
f_n

,并且将所有的

f_n

集合成 特征向量 f .并且将默认的特征(截距)

f_0

设为 1,如下图所示:

  1. 示例 假设训练集中有样本
x^{(i)}

,则可以通过相似度函数计算出其与各个标记点的特征值从而组成特征向量

f^{(i)}

对于第 i 个标记点,由于有定义

x^{(i)}=l^{(i)}

,所以有

f_i^{(i)}=sim(x^{(i)},l^{(i)})=exp(-\frac{0}{2\sigma^{2}})=1

,而定义有 截距特征 为 1,则有以下结果:

应用 SVM

  • 如果已经学到了参数
\theta

,再给定 x 的值,并对 y 做预测,首先要重新计算特征 f,并且要满足式子

"y=1" if\ \theta^{T}f\ge 0

.其中

\theta

也是一个 m+1 维的向量,m 是训练集的数量

  • 此时需要最小化的损失函数如下:
  • 在具体实施过程中,我们还需要对最后的归一化项进行些微调整,在计算
\sum^{n}_{j=1}\theta^{2}_{j}=\theta^{T}\theta

时,我们用

\theta^{T}M\theta

代替

\theta^{T}\theta

其中 M 是根据我们选择的核函数而不同的一个矩阵。这样做的原因是为了简化计算

  • 理论上讲,我们也可以在逻辑回归中使用核函数,但是上面使用 M 来简化计算的方法不适用与逻辑回归,因此计算将非常耗费时间
  • 在此,我们不介绍最小化支持向量机的代价函数的方法,你可以使用现有的软件包(如 liblinear,libsvm 等)。在使用这些软件包最小化我们的代价函数之前,我们通常需要编写核函数,并且如果我们使用高斯核函数,那么在使用之前进行特征缩放是非常必要的。
  • 另外,支持向量机也可以不使用核函数,不使用核函数又称为线性核函数(linear kernel),当我们不采用非常复杂的函数,或者我们的训练集特征非常多而实例非常少的时候,可以采用这种不带核函数的支持向量机

SVM 参数

正则化参数 C

  • 正则化参数 C 和神经网络正则化参数
\lambda

的倒数

\frac{1}{\lambda}

类似

  • 大的 C 对应于小的
\lambda

,这意味着不使用正则化,会得到一个低偏差(bias),高方差(variance)的模型,则会更加倾向于 过拟合

  • 小的 C 对应于大的
\lambda

,这意味着更多的正则化,会得到一个高偏差(bias),低方差(variance)的模型,则会更加倾向于 欠拟合

高斯核函数

\sigma^{2}
  • 如果
\sigma

较大时,曲线较为平滑,会下降地更为 平缓 ,会得到一个高偏差(bias),低方差(variance)的模型,则会更加倾向于 欠拟合

  • 如果
\sigma

较小时,曲线较为陡峭,会下降地更为 迅速 ,会得到一个低偏差(bias),高方差(variance)的模型,则会更加倾向于 过拟合

参考资料

[1]

吴恩达老师课程原地址: https://study.163.com/course/courseMain.htm?courseId=1004570029

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-06-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrawSky 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 12.5 SVM 参数细节
    • 标记点选取
      • 应用 SVM
        • SVM 参数
          • 正则化参数 C
            • 高斯核函数
              • 参考资料
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档