前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【完结】16篇图像分类干货文章总结,从理论到实践全流程大盘点!

【完结】16篇图像分类干货文章总结,从理论到实践全流程大盘点!

作者头像
用户1508658
发布2019-10-14 15:16:46
6430
发布2019-10-14 15:16:46
举报
文章被收录于专栏:有三AI有三AI

专栏《图像分类》正式完结啦!我们从数据集展开讲解,由最基本的多类别图像分类一步步深入到细粒度图像分类、多标签图像分类,再到更加有难度的无监督图像分类,随后我们又对图像分类中面临的各种问题展开描述,较为全面的汇总了图像分类领域的相关内容。至此,我们再对整个图像分类专栏的内容进行一个大总结!

作者 | 郭冰洋 言有三

编辑 | 言有三

1 数据集和经典网络的交响曲

深度学习作为数据驱动的工具,需要大量优质的数据集才可以展开相应的工作。我们详细总结了现阶段图像分类各个领域的数据,并指出其适用的分类任务,为各位读者展开相应的工作,提供了指南针。

同时,我们对经典的图像分类网络进行了总结,详细介绍了图像分类发展史上的重大突破和典型的设计思想。

2 多类别图像分类

多类别图像分类是图像分类最基本的一种,即对含有单一类别目标的图像进行分类。多类别图像分类现在已经融入至生活的方方面面,成功的应用至人脸识别等多个领域。

构建一个完整的图像分类任务,需要通过选择开源框架、构建并读取数据集、网络框架搭建、训练并调试参数、测试准确率五个步骤,本文以pytorch开源框架作为工具,白细胞作为数据集,完成了一个多类别图像分类任务。

3 多标签图像分类

现实生活中的图片中往往包含多个类别的物体,相较于多类别图像分类,这也更加符合人的认知习惯。

多标签图像分类可以告知我们图像中是否同时包含这些内容,这也能够更好地解决实际生活中的问题。

在诸多解决方案中,通过标签转化的方式能够快速的将多类别图像分类的思想迁移到多标签图像分类中。在实战部分,我们借助这个思想,利用ResNet 50作为基础框架,以pascal voc数据集实现了多标签图像分类。

4 细粒度图像分类

细粒度图像分类是在区分出基本类别的基础上,进行更精细的子类划分,如区分鸟的种类、车的款式、狗的品种等,目前在工业界和实际生活中有着广泛的业务需求和应用场景。

细粒度图像相较于粗粒度图像具有更加相似的外观和特征,加之采集中存在姿态、视角、光照、遮挡、背景干扰等影响,导致数据呈现类间差异性大、类内差异性小的现象,从而使分类更加具有难度。

实战部分我们通过经典的双线性网络结构,以CUB数据集完成了一个基本的细粒度分类任务。

5 无监督图像分类

现阶段的图像分类任务在很大程度上是靠监督学习实现的,即每个样本都有其对应的标签,通过深度神经网络来不断学习每个标签所对应的特征,并最终实现分类。这种情况下,数据集的容量、标签的质量往往对模型的性能起到决定性的作用。

高质量数据集自然会带来标注的困难,耗费大量的人力财力。在这种情况下,如何减少标签信息同时保证分类精度,也成了进一步的研究目标,这也是无监督图像分类的发展方向。

6 类别不平衡

类别不平衡是指分类任务中不同类别的训练样本数目相差较大的情况,通常是由于样本较难采集或样本示例较少而引起的,经常出现在疾病类别诊断、欺诈类型判别等任务中。

本篇文章将对目前涉及到的相关解决方案进行汇总,共分为数据层面、算法层面、数据和算法混合层面三个方面,列举具有代表性的方案阐述,以供读者参考。

7 标签噪声

在数据集制作过程中,由于主观、客观的原因,会导致标签噪声的出现,其存在会对最终的分类模型性能造成一定的影响。因此,在实际应用过程中,总是要对现有的数据集进行清洗,以避免标签噪声的干扰。

本文介绍了标签噪声的解决方式,并通过迭代训练的方式进行实战。目前还没有一个完全高效妥善的方式可以解决这一问题,仍然处于一个研究发展的阶段。

8 对抗攻击

基于深度学习的图像分类网络,大多是在精心制作的数据集下进行训练,并完成相应的部署,对于数据集之外的图像或稍加改造的图像,网络的识别能力往往会受到一定的影响。

在愈发重视安全信息的今天,如何提升网络模型对噪声、干扰等对抗样本的鲁棒性,是图像分类的进一步研究目标。

9 可视化

觉得深度学习模型像个黑盒子?不能理解它的工作原理?那就可视化做起来,在这里我们给大家总结了图像分类模型可视化的综述和实战案例。

10 图像分类综述

此外,我们还总结了图像分类的一个综述,用于帮助大家理解不同层级的的图像分类的原理,这也是本专栏开设前的一篇总结文章。

【技术综述】你真的了解图像分类吗?

11 图像分类模型架构

去年我们还总结了12期主流的深度学习模型架构的解读,其中的大部分内容都是图像分类模型,供初学者方便进行系统性学习。如果想了解更多的千奇百怪的模型架构,可以申请加入有三AI知识星球,几百期内容等你来读。

12 主流开源框架分类项目

为了让大家更加容易上手,有三AI开源了12大深度学习开源框架的图像分类项目,从数据准备,模型定义,可视化,训练和测试,图文教程和代码俱全,你还在等什么呢?

总结

几个月的时间来,在自己的努力和三哥的指导下,图像分类专栏终于完结了。希望各位能够在专栏中有所收获,得到一点提升。同时,非常感谢大家对我提出的意见和指导,这些都令我受益匪浅。

这段时间对于我自己来说是一个自我提升、不断突破的阶段。不仅巩固了自己的基础知识,也收获了非常多的经历。这些经历让我明白,踏踏实实做事,向着目标不断努力,就一定会有收获。

最后,还是送给大家专栏开始的那段话:

有志者,事竟成,百二秦关终属楚。

苦心人,天不负,三千越甲可吞吴。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-10-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 有三AI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
人脸识别
腾讯云神图·人脸识别(Face Recognition)基于腾讯优图强大的面部分析技术,提供包括人脸检测与分析、比对、搜索、验证、五官定位、活体检测等多种功能,为开发者和企业提供高性能高可用的人脸识别服务。 可应用于在线娱乐、在线身份认证等多种应用场景,充分满足各行业客户的人脸属性识别及用户身份确认等需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档