前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >[吴恩达机器学习笔记]12支持向量机4核函数和标记点kernels and landmark

[吴恩达机器学习笔记]12支持向量机4核函数和标记点kernels and landmark

作者头像
演化计算与人工智能
发布2020-08-14 14:53:30
7600
发布2020-08-14 14:53:30
举报

12.4 核函数与标记点- Kernels and landmarks

问题引入

  • 如果你有以下的训练集,然后想去拟合其能够分开正负样本的非线性判别边界。
  • 一种办法是构造一个复杂多项式特征的集合:
1\ \ if\ \ \theta_{0}+\theta_{1}x_1+\theta_{2}x_2+\theta_{3}x_1x_2+\theta_{4}x_{1}^{2}+\theta_{5}x_{2}^{2}+...\ge 0\\ 0\ \ otherwise\ \ \end{cases}
  • 然而类似于
x_1x_2或x_1^2及x_2^2

等人为定义的特征是不是最好的呢?我们能不能通过函数来进行学习得到更复杂拟合度更高的特征来解决非线性问题呢?此时我们可以借助于待定系数法,把不同的特征看做是待定的未知的目标进行确定 , 使用

f_n

表示待定的目标特征。

  • 即新的表达式为:

1\ \ if\ \ \theta_{1}f_1+\theta_{2}f_2+\theta_{3}f_3+\theta_{4}f_4+\theta_{5}f_5+\theta_{6}f_6+...\ge 0\\ 0\ \ otherwise\ \ \end{cases}

特征构建

  • 假设此处需要构建 3 个新特征。
    • 首先在坐标
    x_1和x_2

    上选取三个 地标(landmark)

    l^{(1)},l^{(2)},l^{(3)}
    • 然后给定一个样本 x, 定义特征
    f_1

    为样本 x 和地标

    l^{(1)}

    的相似度

    f_1=similarity(x,l^{(1)})=exp(-\frac{||x-l^{(1)}||^2}{2\sigma^{2}})
    • 同样的 定义特征
    f_2

    为样本 x 和地标

    l^{(2)}

    的相似度

    f_2=similarity(x,l^{(2)})=exp(-\frac{||x-l^{(2)}||^2}{2\sigma^{2}})
    • 类似的 定义特征
    f_3

    为样本 x 和地标

    l^{(3)}

    的相似度

    f_3=similarity(x,l^{(3)})=exp(-\frac{||x-l^{(3)}||^2}{2\sigma^{2}})
  • 此处的 相似度函数
exp(-\frac{||x-l^{(n)}||^2}{2\sigma^{2}})

就是所说的 核函数 ,而核函数有很多种,即有很多种不同的定义相似度的方法,此处的核函数被称为 高斯核函数(Gaussian Kernel)

核函数和相似度

  • 公式的展开项如下图所示,从图中可以看出
    • 当 x 和 landmark 十分接近时,特征值为约等于 1
    • 当 x 和 landmark 距离很远时,特征值为约等于 0

高斯核函数(Gaussian Kernel)

  • 假设 地标 1 的坐标为(3,5),使用 3D 图中,即时水平面上对应的坐标为(3,5),核函数使用高斯核,其中
\sigma^{2}=1
  • 等高线表示函数下降的速度 ,以下显示不同
\sigma

对高斯函数陡峭程度的影响,很明显看出

\sigma=0.5

时下降更快,而

\sigma=3

时下降速度减缓:

特征点及边界确定过程

  1. 规定当
\theta_0+\theta_{1}f_1+\theta_{2}f_2+\theta_{3}f_3\ge 0

时输出 1

  1. 假设已经得到参数为
\theta_0=-0.5,\theta_1=1,\theta_2=1,\theta_3=0
  1. 当你对 大量 的训练样本都进行这样的处理,最终会发现一条由大量点组成的 边界 ,显示 距离各个地标何种距离下 输出预测 y 会为 1,否则 y 会为 0.
  1. Note在预测时,采用的不是训练实例本身的特征,而是通过核函数计算出的新特征
f_1,f_2,f_3

参考资料

[1]

吴恩达老师课程原地址: https://study.163.com/course/courseMain.htm?courseId=1004570029

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-06-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrawSky 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 12.4 核函数与标记点- Kernels and landmarks
    • 问题引入
      • 特征构建
        • 核函数和相似度
          • 高斯核函数(Gaussian Kernel)
            • 特征点及边界确定过程
              • 参考资料
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档