专栏首页李智的专栏斯坦福CS231n - CNN for Visual Recognition(1)-lecture2图像分类、最近邻分类器

斯坦福CS231n - CNN for Visual Recognition(1)-lecture2图像分类、最近邻分类器

本节主要简单介绍了图像分类和流程,讲解了最近邻分类器的原理以及超参数的的调优与交叉验证

图像分类

  顾名思义,就是给定一个图像,判断出它属于哪一个类。通常通过带有标签的数据作为训练集用各种方法进行训练, 然后在测试集上进行测试,预测出最可能的类别(标签)。

  图像分类面临的困难:视角变化、大小变化、形变、遮挡、光照条件、背景干扰、类内差异等

  图像分类流程:输入->学习->评价


最近邻分类器

  NN分类器的原理非常简单。针对图像分类来说,就是将给定的图像与带标签的图像逐个像素进行比较,选取距离最小图像的标签作为给定图像类别的预测,这里可以计算L1距离和L2距离。   L1距离公式(绝对值相加) : d1(I1,I2)=∑p|Ip1−Ip2| d_1(I_1,I_2)= \sum\limits_{p} |I_1^p-I_2^p|

  L2距离公式(欧氏距离): d2(I1,I2)=∑p(Ip1−Ip2)2−−−−−−−−−−√ d_2(I_1,I_2)= \sqrt{\sum\limits_{p} (I_1^p-I_2^p)^2}

1. K近邻分类器

  顾名思义,就是选取距离最小的K个图像,将数量最多的标签作为给定图像类别的预测。

KNN优缺点 (1)优点:   算法简单,易于理解,易于实现,不需要参数估计,不需要事先训练。 (2)缺点:   测试需要计算量特别大(实际中关注测试效率远远大于训练效率),训练样本必须存储在本地,内存开销也特别大。 实际中在图像分类中很少使用KNN,因为KNN实质是比较像素的差异,导致图像更多的是按照背景和颜色被分类。

2. 用于超参数调优的验证集

  当我们在设计机器学习算法的时候,除了最终预测的时候使用测试集,其他时候都不能使用(很容易造成过拟合)。我们可以在训练集中分出一部分(50%~90%)作为验证集,在验证集上进行超参数调优。一旦找到最优的超参数,就让算法以该参数在测试集跑且只跑一次,并根据测试结果评价算法。

3. 交叉验证

  当训练集数量较少时,我们一般使用交叉验证的方式(一般分为3、5、10份),比如:将训练集平均分成5份,其中4份用来训练,1份用来验证。然后我们循环着取其中4份来训练,其中1份来验证,最后取所有5次验证结果的平均值作为算法验证结果。


参考资料

链接:http://cs231n.github.io/classification/ 链接:https://zhuanlan.zhihu.com/p/20894041?refer=intelligentunit https://zhuanlan.zhihu.com/p/20900216?refer=intelligentunit 链接:http://blog.csdn.net/han_xiaoyang/article/details/49949535

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Python中对文件夹下的特定格式图像全部读取并转化为数组保存(也可转化为txt文件)

    python下对图像进行批处理少不了读取文件夹下的全部图像,下面就以具体实例分享下对文件夹下的特定格式图像全部读取并转化为数组保存的代码,代码详解请见注释 ...

    李智
  • leetcode(1)Two Sum

    Given an array of integers, return indices of the two numbers such that they add...

    李智
  • DeepLearning tutorial(5)CNN卷积神经网络应用于人脸识别(详细流程+代码实现)

    DeepLearning tutorial(5)CNN卷积神经网络应用于人脸识别(详细流程+代码实现)

    李智
  • 50. 从暗通道先验去雾到海底图像修复-三维重建辅助计算摄影

    我在好几篇文章里面,提到了分离相机接收到的直接光与间接光后,可以有效的进行更高质量的三维重建,获得更精准的场景三维信息。这些文章包括44. Light Stag...

    小白学视觉
  • 数据不够,用GAN来凑!

    在计算机视觉领域,深度学习方法已全方位在各个方向获得突破,这从近几年CVPR 的论文即可看出。

    AI科技大本营
  • MIT 更新最大自然灾害图像数据集,囊括 19 种灾害事件

    内容提要:麻省理工学院在最近 ECCV 2020 上提交的一篇论文中,发布了一套自然灾害图像数据集。这是迄今为止规模最大、质量最高的自然灾害卫星图像数据集。

    HyperAI超神经
  • Reddit热点 | 想看被打码的羞羞图片怎么办?CNN帮你解决

    翻译 | 刘畅 编辑 | Donna,波波 超分辨重构是图像处理领域地一项非常有趣的任务。它可以通过算法将一张低分辨率的图片放大成一张高分辨率地图片。这个事情乍...

    AI科技大本营
  • 基于深度学习的图像增强综述

    图像增强的定义非常广泛,一般来说,图像增强是有目的地强调图像的整体或局部特性,例如改善图像的颜色、亮度和对比度等,将原来不清晰的图像变得清晰或强调某些感兴趣的特...

    Natalia_ljq
  • 使用深度学习来实现超分辨率的介绍

    超分辨率是从给定的低分辨率(LR)图像中恢复高分辨率(HR)图像的过程。由于较小的空间分辨率(即大小)或退化的结果(如模糊),图像可能具有“较低的分辨率”。我们...

    小白学视觉
  • 使用深度学习来实现超分辨率的介绍

    超分辨率是从给定的低分辨率(LR)图像中恢复高分辨率(HR)图像的过程。由于较小的空间分辨率(即大小)或退化的结果(如模糊),图像可能具有“较低的分辨率”。我们...

    AI算法与图像处理

扫码关注云+社区

领取腾讯云代金券