开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

CNN图像分类:它总是给我相同的预测

卷积神经网络（CNN）是一种深度学习模型，它在图像分类任务中表现出色。CNN通过学习图像中的特征层次结构来进行分类。如果你在使用CNN进行图像分类时总是得到相同的预测，可能是以下几个原因造成的：

原因分析：

数据集问题：
- 数据不平衡：如果训练数据集中某一类的图像数量远多于其他类，模型可能会倾向于预测数量最多的类别。
- 数据不足：如果训练数据量太少，模型可能无法学习到足够的特征来区分不同的类别。

模型问题：
- 过拟合：模型在训练数据上表现很好，但在未见过的数据上表现不佳。这可能是因为模型过于复杂，学习到了训练数据中的噪声而非真正的特征。
- 欠拟合：模型过于简单，无法捕捉到数据中的复杂特征。
训练问题：
- 学习率设置不当：学习率过高可能导致模型无法收敛，而学习率过低可能导致训练过慢或陷入局部最优。
- 训练轮数不足：如果训练的轮数不够，模型可能还没有充分学习。
初始化问题：
- 权重初始化不当可能导致模型难以收敛。

解决方案：

数据增强：通过对训练数据进行旋转、缩放、裁剪等操作来增加数据多样性，提高模型的泛化能力。
平衡数据集：确保每个类别的图像数量大致相同，或者使用重采样技术来平衡数据集。
调整模型复杂度：根据问题的复杂度调整模型的层数和每层的神经元数量。
正则化：使用L1、L2正则化或Dropout来减少过拟合。
优化训练过程：
- 使用学习率调度器来动态调整学习率。
- 增加训练轮数，直到模型收敛。

权重初始化：使用合适的权重初始化方法，如He初始化或Xavier初始化。

示例代码（使用TensorFlow/Keras）：

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# 假设我们有一个简单的CNN模型
model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(64, 64, 3)),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Conv2D(128, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Flatten(),
    Dense(128, activation='relu'),
    Dropout(0.5),
    Dense(10, activation='softmax')  # 假设有10个类别
])

# 编译模型
model.compile(optimizer=Adam(learning_rate=0.001),
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

# 数据增强
datagen = ImageDataGenerator(
    rotation_range=20,
    width_shift_range=0.2,
    height_shift_range=0.2,
    horizontal_flip=True,
    validation_split=0.2)

train_generator = datagen.flow_from_directory(
    'path_to_training_data',
    target_size=(64, 64),
    batch_size=32,
    class_mode='sparse',
    subset='training')

validation_generator = datagen.flow_from_directory(
    'path_to_training_data',
    target_size=(64, 64),
    batch_size=32,
    class_mode='sparse',
    subset='validation')

# 训练模型
model.fit(train_generator,
          validation_data=validation_generator,
          epochs=50)

参考链接：

通过上述方法，你可以诊断并解决CNN图像分类总是给出相同预测的问题。

相关搜索:图像分类Cnn模型总是给出相同的结果奇怪的Keras CNN图像分类器预测使用CNN进行癌症预测的分类 python中CNN多类图像分类的边界框预测 Tensorflow预训练CNN:预测图像的相同类别 Python语言中的MXNet分类总是给出相同的预测 Tensorflow图像分类Python总是说相同的答案 CNN模型预测任何输入的相同输出基于CNN的多类图像分类二值图像分类器总是预测一个类别 Sklearn Same总是返回相同的预测为什么optim()总是给我相同的结果？使用CNN keras提取错误分类的图像使用CNN进行图像二分类，但它总是将所有内容预测到一个类别中 Tensorflow模型总是预测相同的错误值为什么我的Keras图像分类预测总是返回一个值...？为什么我的for循环总是给我相同的结果？当输出正常时，Tensorflow总是给我相同的结果 python中的图像分类预测不准确如何使用动态输入创建用于图像分类的CNN

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

深度学习目标检测从入门到精通：第一篇

【导读】近日，CV-Tricks.com发布一篇文章，总结了近年来目标检测的各种方法。目标检测可谓是近年来计算机视觉领域热门的研究领域，也具有广阔的应用前景，如自动驾驶等。本文首先系统解释了图像分类和

07

【计算机视觉】检测与分割详解

【导读】神经网络在计算机视觉领域有着广泛的应用。只要稍加变形，同样的工具和技术就可以有效地应用于广泛的任务。在本文中，我们将介绍其中的几个应用程序和方法，包括语义分割、分类与定位、目标检测、实例分割。

01

AI+明厨亮灶解决方案

AI+明厨亮灶解决方案通过python+yolo网络模型分析算法，AI+明厨亮灶解决方案可接对后厨实现如口罩识别、厨师服穿戴、夜间老鼠监测、厨师帽识别、厨师玩手机打电话识别、抽烟识别等实时分析监测。Python是一种由Guido van Rossum开发的通用编程语言，它很快就变得非常流行，主要是因为它的简单性和代码可读性。它使程序员能够用更少的代码行表达思想，而不会降低可读性。与C / C++等语言相比，Python速度较慢。也就是说，Python可以使用C / C++轻松扩展，这使我们可以在C / C++中编写计算密集型代码，并创建可用作Python模块的Python包装器。这给我们带来了两个好处：首先，代码与原始C / C++代码一样快（因为它是在后台工作的实际C++代码），其次，在Python中编写代码比使用C / C++更容易。OpenCV-Python是原始OpenCV C++实现的Python包装器。

02

推荐｜改变你对世界看法的五大计算机视觉技术！

计算机视觉是当前最热门的研究之一，是一门多学科交叉的研究，涵盖计算机科学（图形学、算法、理论研究等）、数学（信息检索、机器学习）、工程（机器人、NLP等）、生物学（神经系统科学）和心理学（认知科学）。由于计算机视觉表示对视觉环境及背景的相对理解，很多科学家相信，这一领域的研究将为人工智能行业的发展奠定基础。那么，什么是计算机视觉呢？下面是一些公认的定义：从图像中清晰地、有意义地描述物理对象的结构（Ballard & Brown，1982）；由一个或多个数字图像计算立体世界的性质（Trucco & Ve

08

改变你对世界看法的五大计算机视觉技术！

计算机视觉是当前最热门的研究之一，是一门多学科交叉的研究，涵盖计算机科学（图形学、算法、理论研究等）、数学（信息检索、机器学习）、工程（机器人、NLP等）、生物学（神经系统科学）和心理学（认知科学）。由于计算机视觉表示对视觉环境及背景的相对理解，很多科学家相信，这一领域的研究将为人工智能行业的发展奠定基础。

00

如何通过深度学习，完成计算机视觉中的所有工作？

https://miro.medium.com/max/1200/1*s9raSe9mLeSSuxE3API-ZA.gif

01

干货 | 万物皆可「计算机视觉」

想做计算机视觉？深度学习是最近的发展方向。大规模数据集加上深度卷积神经网络（CNNs）的表征能力使得超精确和稳健的模型成为可能。现在只剩下一个挑战：如何设计你的模型。

03

多标签图像分类综述

图像分类作为计算机视觉领域的基础任务，经过大量的研究与试验，已经取得了傲人的成绩。然而，现有的分类任务大多是以单标签分类展开研究的。当图片中有多个标签时，又该如何进行分类呢？本篇综述将带领大家了解多标签图像分类这一方向，了解更具难度的图像分类。

03

关于图像分类、图像识别和目标检测异同

计算机视觉是人工智能领域的一个重要分支，它旨在构建能够理解和处理图像、视频等视觉信息的计算机系统。在计算机视觉领域中，图像分类、图像识别和目标检测是三个重要的任务，当然目标跟踪、图像生成也是新的方向和延伸。

01

【技术综述】多标签图像分类综述

图像分类作为计算机视觉领域的基础任务，经过大量的研究与试验，已经取得了傲人的成绩。然而，现有的分类任务大多是以单标签分类展开研究的。当图片中有多个标签时，又该如何进行分类呢？本篇综述将带领大家了解多标签图像分类这一方向，了解更具难度的图像分类。

00

Python人工智能 | 十.Tensorflow+Opencv实现CNN自定义图像分类案例及与KNN对比

前一篇文章详细讲解了卷积神经网络CNN原理，并通过TensorFlow编写CNN实现了MNIST分类学习案例。本篇文章将通过Tensorflow和Opencv实现CNN自定义图像分类案例，它能解决我们现实论文或实践中的图像分类问题，并与机器学习的图像分类算法进行对比实验。

02

兜兜转转一个圈，闲聊一下What is all you need?

最近读论文、看文章发现了两件有意思的事情，今天有时间分享闲聊一下，其一是各种MLP的论文频出，从各个方面对Transformer进行“围攻”，这让人有种“大道至简”的感觉；其二是“XXX is all you need”的标题文章和论文层出，让人有种“通货膨胀”的感觉。

03

【技术综述】多标签图像分类综述

图像分类作为计算机视觉领域的基础任务，经过大量的研究与试验，已经取得了傲人的成绩。然而，现有的分类任务大多是以单标签分类展开研究的。当图片中有多个标签时，又该如何进行分类呢？本篇综述将带领大家了解多标签图像分类这一方向，了解更具难度的图像分类。

01

裸露土堆识别算法

裸露土堆识别算法首先利用图像处理技术，提取出图像中的土堆区域。裸露土堆识别算法首通过计算土堆中被绿色防尘网覆盖的比例，判断土堆是否裸露。若超过40%的土堆没有被绿色防尘网覆盖，则视为裸露土堆。当我们谈起裸露土堆识别算法计算机视觉时，首先想到的就是图像分类，没错，图像分类是计算机视觉最基本的任务之一，但是在图像分类的基础上，还有更复杂和有意思的任务，如目标检测，物体定位，图像分割等。其中目标检测是一件比较实际的且具有挑战性的计算机视觉任务，其可以看成图像分类与定位的结合，给定一张图片，裸露土堆识别算法目标检测系统要能够识别出图片的目标并给出其位置，由于图片中目标数是不定的，且要给出目标的精确位置，目标检测相比分类任务更复杂。

02

河道船舶识别检测系统

河道船舶识别检测系统通过ppython+YOLOv5网络模型算法技术，河道船舶识别检测系统对画面中的船只进行7*24小时实时监测，若发现存在进行违规采砂或者捕鱼立即自动抓拍触发告警。与C / C++等语言相比，Python速度较慢。也就是说，Python可以使用C / C++轻松扩展，这使我们可以在C / C++中编写计算密集型代码，并创建可用作Python模块的Python包装器。这给我们带来了两个好处：首先，代码与原始C / C++代码一样快（因为它是在后台工作的实际C++代码），其次，在Python中编写代码比使用C / C++更容易。OpenCV-Python是原始OpenCV C++实现的Python包装器。Python是一种由Guido van Rossum开发的通用编程语言，它很快就变得非常流行，主要是因为它的简单性和代码可读性。它使程序员能够用更少的代码行表达思想，而不会降低可读性。

00

详解计算机视觉五大技术：图像分类、对象检测、目标跟踪、语义分割和实例分割

译者 | 王柯凝【 AI 科技大本营导读】目前，计算机视觉是深度学习领域最热门的研究领域之一。计算机视觉实际上是一个跨领域的交叉学科，包括计算机科学（图形、算法、理论、系统、体系结构），数学（信息检索、机器学习），工程学（机器人、语音、自然语言处理、图像处理），物理学（光学），生物学（神经科学）和心理学（认知科学）等等。许多科学家认为，计算机视觉为人工智能的发展开拓了道路。那么什么是计算机视觉呢？这里给出了几个比较严谨的定义： ✦ “对图像中的客观对象构建明确而有意义的描述”（Ballard＆B

07

详解计算机视觉五大技术：图像分类、对象检测、目标跟踪、语义分割和实例分割

目前，计算机视觉是深度学习领域最热门的研究领域之一。计算机视觉实际上是一个跨领域的交叉学科，包括计算机科学（图形、算法、理论、系统、体系结构），数学（信息检索、机器学习），工程学（机器人、语音、自然语言处理、图像处理），物理学（光学），生物学（神经科学）和心理学（认知科学）等等。许多科学家认为，计算机视觉为人工智能的发展开拓了道路。

02

关于CNN图像分类的一份综合设计指南

对于计算机视觉任务而言，图像分类是其中的主要任务之一，比如图像识别、目标检测等，这些任务都涉及到图像分类。而卷积神经网络（CNN）是计算机视觉任务中应用最为广泛且最为成功的网络之一。大多数深度学习研究者首先从CNN入门，上手的第一个项目应该是手写体MNIST数字图像识别，通过该项目能够大致掌握图像分类的基本操作流程，但由于该项目太成熟，按步骤操作一遍可能只知其然而不知其所以然。所以，当遇到其它图像分类任务时，研究者可能不知道如何开始，或者不知道选取怎样的预训练网络模型、或者不知道对已有的成熟模型进行怎样的调整、模型的层数怎样设计、如何提升精度等，这些问题都是会在选择使用卷积神经模型完成图像分类任务时应该考虑的问题。当选择使用CNN进行图像分类任务时，需要优化3个主要指标：精度、仿真速度以及内存消耗。这些性能指标与设计的模型息息相关。不同的网络会对这些性能指标进行权衡，比如VGG、Inception以及ResNets等。常见的做法是对这些成熟的模型框架进行微调、比如通过增删一些层、使用扩展的其它层以及一些不同的网络训练技巧等完成相应的图像分类任务。本文是关于使用CNN进行图像分类任务的优化设计指南，方便读者快速掌握图像分类模型设计中所遇到的问题及经验。全文集中在精度、速度和内存消耗这三个性能指标进行扩展，介绍不同的CNN分类方法，并探讨这些方法在这三个性能指标上的表现。此外，还可以看到对这些成熟的CNN方法进行各种修改以及修改后的性能表现。最后，将学习如何针对特定的图像分类任务优化设计一个CNN网络模型。

03

图像处理之目标检测的入门总结

目标检测，object detection，就是在给定的图片中精确找到物体所在位置，并标注出物体的类别。

01

AAAI|MetaDelta：一种少样本图像分类的元学习系统AAAI|MetaDelta：一种少样本图像分类的元学习系统

今天给大家介绍清华大学YudongChen等人发表在AAAI上的一篇文章 “MetaDelta:AMeta-LearningSystemforFew-shotImageClassifification” 。现有的元学习算法很少考虑未知数据集的时间和资源效率或泛化能力，这限制了它们在实际场景中的适用性。在这篇文章中，作者提出了一种新的实用的元学习系统MetaDelta，用于小镜头图像分类。MetaDelta由两个核心组件组成：(1)由中央控制器监督的多个meta-learners以确保效率，(2)一个元集成模块负责集成推理和更好的泛化。MetaDelta的每个meta-learner都由一个经过批量训练的预训练编码器和用于预测的无参数解码器组成。

05

这5种计算机视觉技术，刷新你的世界观

计算机视觉是目前深度学习领域最热门的研究领域之一。它位于许多学术科目的交汇点，如计算机科学（图形学，算法，理论，系统，建筑），数学（信息检索，机器学习），工程学（机器人学，语音，自然语言处理，图像处理），物理学（光学），生物学（神经科学）和心理学（认知科学）。由于计算机视觉代表了对视觉环境及其背景的相对理解，许多科学家认为，该领域由于其跨域掌握为人工智能铺平了道路。

03

见微知著：细粒度图像分析进展

作者简介：魏秀参，南京大学计算机系机器学习与数据挖掘所（LAMDA）博士生，专攻计算机视觉和机器学习。曾在国际顶级期刊和会议发表多篇学术论文，并两次获得国际计算机视觉相关竞赛冠亚军。责编：何永灿，欢迎人工智能领域技术投稿、约稿、给文章纠错，请发送邮件至heyc@csdn.net 本文为《程序员》原创文章，未经允许不得转载，更多精彩文章请订阅2017年《程序员》有别于通用图像分析任务，细粒度图像分析的所属类别和粒度更为精细，它不仅能在更细分的类别下对物体进行识别，就连相似度极高的同一物种也能区别开来。

04

视觉实战｜使用人工神经网络进行图像分类

SPCA每年要收养7000到9000只动物，其中有一半是抛弃的宠物，例如猫，狗，兔子和豚鼠等。识别这些宠物需要一定的时间，可能会增加等待收养的时间。

01

面试商汤，效率太恐怖了。。。

今天看到一个帖子，说是商汤面试的氛围很好，面试的内容很仔细，而且整体下来的效率非常高。

01

如何构建用于垃圾分类的图像分类器

当垃圾处理不当时，就会发生回收污染 - 比如回收带有油的披萨盒。或者当垃圾被正确处理但准备不当时 - 如回收未经冲洗的果酱罐。

03

计算机视觉八大任务全概述：PaddlePaddle工程师详解热门视觉模型

百度深度学习工程师，围绕计算机视觉领域的八大任务，包括：图像分类、目标检测、图像语义分割、场景文字识别、图像生成、人体关键点检测、视频分类、度量学习等，进行了较为详细的综述并形成此文。

02

【AI有识境】如何掌握好图像分类算法？

进入到有识境界，可以大胆地说自己是一个非常合格的深度学习算法工程师了，能够敏锐地把握自己研究的领域，跟踪前沿和能落地的技术，对自己暂时不熟悉的领域也能快速地触类旁通。

02

细粒度图像分类（FGVC）—综述

Awesome Fine-grained Visual Classification Awesome Fine-Grained Image Analysis – Papers, Codes and Datasets—-weixiushen

02

计算机视觉八大任务全概述：PaddlePaddle工程师详解热门视觉模型

来自百度的深度学习工程师，围绕计算机视觉领域的八大任务，包括：图像分类、目标检测、图像语义分割、场景文字识别、图像生成、人体关键点检测、视频分类、度量学习等，进行了较为详细的综述并形成此文。

06

实际上，CNN图像分类策略简单到出人意料！

在这篇文章中，作者展示了为什么最先进的深度神经网络仍能很好地识别乱码图像，探究其中原因有助于揭示DNN使用让人意想不到的简单策略，对自然图像进行分类。

04

深度学习与CV教程(12) | 目标检测 (两阶段,R-CNN系列)

本系列为斯坦福CS231n 《深度学习与计算机视觉(Deep Learning for Computer Vision)》的全套学习笔记，对应的课程视频可以在这里查看。更多资料获取方式见文末。

03

细粒度图像分析_图像分类研究现状

Awesome Fine-grained Visual Classification Awesome Fine-Grained Image Analysis – Papers, Codes and Datasets—-weixiushen

02

R-CNN 物体检测第一弹

今天，重读了 R-CNN 的 TPAMI 版本，感觉受益颇多。该版相比之前的会议版，在检测流程和实现细节上表述得更为清晰。此外，因为是改投 TPAMI 的关系，因此文中补充了很多额外的实验和分析，尤其是检测系统为什么最后设计成这样的缘由。接下来，我就简要记录一下这篇文章的主要思想和作者对检测的思考，也加入我个人的理解。缘起为了推动计算机视觉领域的研究进展，斯坦福大学的 Li Feifei 组根据 wordnet 的思想，建立了一个包罗了近乎海量图片的数据库ImageNet 。在那个 SVM 还异常火热的

06

精品连载|“深度学习与计算机视觉”学习笔记——应用篇

图像分类，这个是计算机视觉的基础任务，主要包含通用图像分类和细粒度图像分类，其中细粒度分类，需进一步从大类中进行细分类，比如识别狗是哪个品种。

02

毕业设计（基于Tensorflow的深度研究与实现）之番外篇

本文是我的毕业设计基于Tensorflow的深度学习与研究的番外篇，在这篇文章中，我将解决以下两个问题：

01

CNN卷积神经网络原理详解（上）

卷积网络（convolutional network),也叫作卷积神经网络（convolutional neural network,CNN),是一种专门用来处理具有类似网格结构的数据的神经网络。卷积网络在诸多应用领域都表现优异。‘卷积神经网络’一词表明该网络使用了卷积（convolutional)这种数学运算。卷积神经网络的运作模式如下图所示：

02

神经网络似乎遵循一种令人费解的简单策略来对图像进行分类

在这篇文章中，我将展示为什么最先进的深度神经网络仍能很好地识别乱码图像，以及这有助于揭示DNN似乎用来对自然图像进行分类的令人费解的简单策略。这些发现发表在ICLR 2019，有许多分歧：首先，它们表明解决ImageNet比许多人想象的要简单得多。其次，这些发现使我们能够构建更具解释性和透明度的图像分类流水线。第三，他们解释了现代CNN中观察到的一些现象，例如他们对纹理的偏见（参见我们在ICLR 2019的另一篇论文和我们相应的博客文章）以及他们忽略了对象部分的空间排序。

04

总结 | 优必选悉尼AI研究院何诗怡：基于课程学习的强化多标签图像分类算法

与单标签图像分类相比，多标签图像分类是一种更符合真实世界客观规律的方法，尤其在图像和视频的语义标注，基于内容的图像检索等领域有着广泛的应用。

03

增加检测类别？这是一份目标检测的基础指南

作者： Adrian Rosebrock 机器之心编译目标检测技术作为计算机视觉的重要方向，被广泛应用于自动驾驶汽车、智能摄像头、人脸识别及大量有价值的应用上。这些系统除了可以对图像中的每个目标进行识别、分类以外，它们还可以通过在该目标周围绘制适当大小的边界框来对其进行定位。本文作者从图像识别与目标检测的区别开始，进一步简单介绍了目标检测的基本模块与实现方法。本文是目标检测的一般指南，它并没有详细介绍主流的目标检测算法，这些算法读者可参考从 RCNN 到 SSD，这应该是最全的一份目标检测算法盘点

05

视频 | 手把手教你构建图片分类器，备战 kaggle 大赛！

AI 研习社按：今天为大家带来硅谷深度学习网红 Siraj 的一则教学视频：如何从零开始构建一个图像分类器来对猫和狗进行分类。（内心OS：终于要开始图像部分了！）具体视频内容如下，Github 链接详见文末“阅读原文”。为了照顾没有 WiFi 的小伙伴，我们特别提供了以下根据视频内容整理的文字版（hin 贴心有木有！）：图像分类发展历史在80年代和90年代初出现了一些不同的尝试，都用了类似的方法——根据图片的构成特征来给每张图片手动编码进行分类，但变量实在太多了——世界上没有相同的两片叶子。所以结

04

教你用Keras做图像识别！只会图像检测并不强力

AI 研习社按：今天为大家带来硅谷深度学习网红 Siraj 的一则教学视频：如何从零开始构建一个图像分类器来对猫和狗进行分类。（内心OS：终于要开始图像部分了！）具体视频内容如下，Github 链接详见文末“阅读原文”。为了照顾没有 WiFi 的小伙伴，我们特别提供了以下根据视频内容整理的文字版（hin 贴心有木有！）：图像分类发展历史在80年代和90年代初出现了一些不同的尝试，都用了类似的方法——根据图片的构成特征来给每张图片手动编码进行分类，但变量实在太多了——世界上没有相同的两片叶子。所以结

08

目标检测101：一文带你读懂深度学习框架下的目标检测

大数据文摘作品编译：及子龙，张礼俊余志文，钱天培从简单的图像分类到3D位置估算，在机器视觉领域里从来都不乏有趣的问题。其中我们最感兴趣的问题之一就是目标检测。如同其他的机器视觉问题一样，目标检测目前为止还没有公认最好的解决方法。在了解目标检测之前，让我们先快速地了解一下这个领域里普遍存在的一些问题。目标检测 vs 其他计算机视觉问题图像分类在计算机视觉领域中，最为人所知的问题便是图像分类问题。图像分类是把一幅图片分成多种类别中的一类。 ImageNet是在学术界使用的最受欢迎的数据集之一

04

简单到出人意料的CNN图像分类策略

在这篇文章中，作者展示了为什么最先进的深度神经网络仍能很好地识别乱码图像，探究其中原因有助于揭示DNN使用让人意想不到的简单策略，对自然图像进行分类。

02

NeurIPS2021 港大&腾讯AI Lab&牛津提出：CARE，让CNN和Transformer能在对比学习中“互帮互助”！

本文分享NeurIPS 2021 论文『Revitalizing CNN Attentions via Transformers in Self-Supervised Visual Representation Learning』，由港大&腾讯AI Lab&牛津大学联合提出 CARE，让 CNN 和 Transformer 能在对比学习中“互帮互助”！

02

重磅|基于深度学习的目标检测综述(一）

作者：叶虎编辑：黄俊嘉前言图像分类，检测及分割是计算机视觉领域的三大任务。图像分类模型（详情见[这里](https://medium.com/comet-app/review-of-deep-learning-algorithms-for-image-classification-5fdbca4a05e2)）是将图像划分为单个类别，通常对应于图像中最突出的物体。但是现实世界的很多图片通常包含不只一个物体，此时如果使用图像分类模型为图像分配一个单一标签其实是非常粗糙的，并不准确。对于这

05

TensorFlow2.0 初学者视频教程 by KGP Talkie | 附github链接&视频已上传B站

在mBreath Technologies担任数据科学家，在IIT Kharagpur担任高级研究学者。凭借我3年以上的数据科学，团队管理，业务发展，客户分析经验，以及5年以上的医疗保健领域经验，我相信我拥有将知识，驱动力和技术技能完美地添加到任何领域的经验数据科学团队。

02

[深度思考]·探究训练集样本不平衡问题对CNN的影响与解决方法（转）

卷积神经网络（CNN）可以说是目前处理图像最有力的工具了。而在机器学习分类问题中，样本不平衡又是一个经常遇到的问题。最近在使用CNN进行图片分类时，发现CNN对训练集样本不平衡问题很敏感。在网上搜索了一下，发现这篇文章对这个问题已经做了比较细致的探索。于是就把它简单整理了一下，相关的记录如下。

02

使用 CNN 进行图像分类

图像分类顾名思义就是一个模式分类问题，它的目标是将不同的图像，划分到不同的类别，实现最小的分类误差。 1，单标签分类：总体来说，对于单标签的图像分类问题，它可以分为跨物种语义级别的图像分类(cifar10)，子类细粒度图像分类(Caltech-UCSD Birds-200-2011)，以及实例级图像分类(人脸识别)三大类别。

01

三个自动化深度学习平台比较和盘点

数据科学领域有一部分研究者和开发者已经选择学习这些新技术了，但在预测性和规范性建模的问题类型和技术方面（我们 90% 的工作就是这些），学习深度学习技术却与我们的大部分工作方向背道而驰。

02

业界 | 人人都能用的深度学习：当前三大自动化深度学习平台简介

选自DataScienceCentral 作者：William Vorhies 机器之心编译参与：Panda 深度学习技术往往比较复杂，从头开发的难度较大，但现在有一些公司提供了能帮助开发者轻松使用深度学习的自动化深度学习（ADL）平台，比如微软的 CustomVision.AI、谷歌的 Cloud AutoML、OneClick.AI。Data Science Central 近日发文对这三个平台进行了比较和盘点，机器之心对该文做了编译介绍。阻碍我们使用深度学习方法的原因有很多，其中最主要的是深度学习

04

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭