【完结】16篇图像分类干货文章总结，从理论到实践全流程大盘点！

用户1508658

发布于 2019-10-14 15:16:46

7490

发布于 2019-10-14 15:16:46

文章被收录于专栏：有三AI

专栏《图像分类》正式完结啦！我们从数据集展开讲解，由最基本的多类别图像分类一步步深入到细粒度图像分类、多标签图像分类，再到更加有难度的无监督图像分类，随后我们又对图像分类中面临的各种问题展开描述，较为全面的汇总了图像分类领域的相关内容。至此，我们再对整个图像分类专栏的内容进行一个大总结！

作者 | 郭冰洋言有三

编辑 | 言有三

1 数据集和经典网络的交响曲

深度学习作为数据驱动的工具，需要大量优质的数据集才可以展开相应的工作。我们详细总结了现阶段图像分类各个领域的数据，并指出其适用的分类任务，为各位读者展开相应的工作，提供了指南针。

同时，我们对经典的图像分类网络进行了总结，详细介绍了图像分类发展史上的重大突破和典型的设计思想。

2 多类别图像分类

多类别图像分类是图像分类最基本的一种，即对含有单一类别目标的图像进行分类。多类别图像分类现在已经融入至生活的方方面面，成功的应用至人脸识别等多个领域。

构建一个完整的图像分类任务，需要通过选择开源框架、构建并读取数据集、网络框架搭建、训练并调试参数、测试准确率五个步骤，本文以pytorch开源框架作为工具，白细胞作为数据集，完成了一个多类别图像分类任务。

【图像分类】基于Pytorch的多类别图像分类实战

3 多标签图像分类

现实生活中的图片中往往包含多个类别的物体，相较于多类别图像分类，这也更加符合人的认知习惯。

多标签图像分类可以告知我们图像中是否同时包含这些内容，这也能够更好地解决实际生活中的问题。

在诸多解决方案中，通过标签转化的方式能够快速的将多类别图像分类的思想迁移到多标签图像分类中。在实战部分，我们借助这个思想，利用ResNet 50作为基础框架，以pascal voc数据集实现了多标签图像分类。

4 细粒度图像分类

细粒度图像分类是在区分出基本类别的基础上，进行更精细的子类划分，如区分鸟的种类、车的款式、狗的品种等，目前在工业界和实际生活中有着广泛的业务需求和应用场景。

细粒度图像相较于粗粒度图像具有更加相似的外观和特征，加之采集中存在姿态、视角、光照、遮挡、背景干扰等影响，导致数据呈现类间差异性大、类内差异性小的现象，从而使分类更加具有难度。

实战部分我们通过经典的双线性网络结构，以CUB数据集完成了一个基本的细粒度分类任务。

5 无监督图像分类

现阶段的图像分类任务在很大程度上是靠监督学习实现的，即每个样本都有其对应的标签，通过深度神经网络来不断学习每个标签所对应的特征，并最终实现分类。这种情况下，数据集的容量、标签的质量往往对模型的性能起到决定性的作用。

高质量数据集自然会带来标注的困难，耗费大量的人力财力。在这种情况下，如何减少标签信息同时保证分类精度，也成了进一步的研究目标，这也是无监督图像分类的发展方向。

【图像分类】简述无监督图像分类发展现状

6 类别不平衡

类别不平衡是指分类任务中不同类别的训练样本数目相差较大的情况，通常是由于样本较难采集或样本示例较少而引起的，经常出现在疾病类别诊断、欺诈类型判别等任务中。

本篇文章将对目前涉及到的相关解决方案进行汇总，共分为数据层面、算法层面、数据和算法混合层面三个方面，列举具有代表性的方案阐述，以供读者参考。

【图像分类】关于图像分类中类别不平衡那些事

7 标签噪声

在数据集制作过程中，由于主观、客观的原因，会导致标签噪声的出现，其存在会对最终的分类模型性能造成一定的影响。因此，在实际应用过程中，总是要对现有的数据集进行清洗，以避免标签噪声的干扰。

本文介绍了标签噪声的解决方式，并通过迭代训练的方式进行实战。目前还没有一个完全高效妥善的方式可以解决这一问题，仍然处于一个研究发展的阶段。

【图像分类】标签噪声对分类性能会有什么样的影响？

8 对抗攻击

基于深度学习的图像分类网络，大多是在精心制作的数据集下进行训练，并完成相应的部署，对于数据集之外的图像或稍加改造的图像，网络的识别能力往往会受到一定的影响。

在愈发重视安全信息的今天，如何提升网络模型对噪声、干扰等对抗样本的鲁棒性，是图像分类的进一步研究目标。

【图像分类】图像分类中的对抗攻击是怎么回事？

9 可视化

觉得深度学习模型像个黑盒子？不能理解它的工作原理？那就可视化做起来，在这里我们给大家总结了图像分类模型可视化的综述和实战案例。

10 图像分类综述

此外，我们还总结了图像分类的一个综述，用于帮助大家理解不同层级的的图像分类的原理，这也是本专栏开设前的一篇总结文章。

【技术综述】你真的了解图像分类吗？

11 图像分类模型架构

去年我们还总结了12期主流的深度学习模型架构的解读，其中的大部分内容都是图像分类模型，供初学者方便进行系统性学习。如果想了解更多的千奇百怪的模型架构，可以申请加入有三AI知识星球，几百期内容等你来读。

【完结】总结12大CNN主流模型架构设计思想

12 主流开源框架分类项目

为了让大家更加容易上手，有三AI开源了12大深度学习开源框架的图像分类项目，从数据准备，模型定义，可视化，训练和测试，图文教程和代码俱全，你还在等什么呢？

【完结】给新手的12大深度学习开源框架快速入门项目

总结

几个月的时间来，在自己的努力和三哥的指导下，图像分类专栏终于完结了。希望各位能够在专栏中有所收获，得到一点提升。同时，非常感谢大家对我提出的意见和指导，这些都令我受益匪浅。

这段时间对于我自己来说是一个自我提升、不断突破的阶段。不仅巩固了自己的基础知识，也收获了非常多的经历。这些经历让我明白，踏踏实实做事，向着目标不断努力，就一定会有收获。

最后，还是送给大家专栏开始的那段话：

有志者，事竟成，百二秦关终属楚。

苦心人，天不负，三千越甲可吞吴。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2019-10-11，如有侵权请联系 cloudcommunity@tencent.com 删除

深度学习

开源

本文分享自有三AI 微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

深度学习

开源

登录后参与评论

0 条评论

热度

【完结】16篇图像分类干货文章总结，从理论到实践全流程大盘点！

【完结】16篇图像分类干货文章总结，从理论到实践全流程大盘点！

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐