开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

CNN算法预测值为1.0，因此交叉熵成本函数会给出被零除的警告

CNN算法是卷积神经网络（Convolutional Neural Network）的缩写，是一种常用于图像处理和计算机视觉任务的深度学习算法。

预测值为1.0意味着CNN算法对于某个样本的分类结果非常确信，即它预测该样本属于某个特定的类别的概率非常高。

交叉熵成本函数（Cross Entropy Cost Function）是用于衡量预测值与实际值之间的差异程度的一种损失函数。它常用于分类问题中，通过计算预测值与实际值的差异来衡量模型的性能，进而优化模型的参数。

在交叉熵成本函数中，被零除的警告通常是由于预测值为1.0时，算法将该样本归为某个类别的概率为1.0，而实际上该样本却不属于该类别，导致计算交叉熵时出现分母为零的情况。这通常是由于模型的训练过程中出现了问题，例如训练数据中存在标注错误或样本不平衡等。

解决这个问题的方法可以是：

检查数据集中的标注是否正确，确保训练数据的标签与实际情况相符。
检查模型是否过拟合，如果模型在训练数据上表现非常好但在测试数据上表现不佳，可能需要调整模型的复杂度或增加正则化项。
尝试使用其他的损失函数替代交叉熵成本函数，例如平方误差损失函数。

腾讯云相关产品和产品介绍链接地址：

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

tensorflow中损失函数的用法

分类问题和回归问题是监督学习的两大种类。这一节将分别介绍分类问题和回归问题中使用到的经典损失函数。分类问题希望解决的是将不同的样本分到事先定义到的经典损失函数。分类问题希望解决的将不同的样本分到事先定义好的类别中。

04

可视化理解 Binary Cross-Entropy

如果你正在训练一个二分类器，很有可能你正在使用的损失函数是二值交叉熵/对数(binary cross-entropy / log)。

06

【计算机视觉】检测与分割详解

【导读】神经网络在计算机视觉领域有着广泛的应用。只要稍加变形，同样的工具和技术就可以有效地应用于广泛的任务。在本文中，我们将介绍其中的几个应用程序和方法，包括语义分割、分类与定位、目标检测、实例分割。

01

深度学习基础入门篇[五]:交叉熵损失函数、MSE、CTC损失适用于字识别语音等序列问题、Balanced L1 Loss适用于目标检测

在物理学中，“熵”被用来表示热力学系统所呈现的无序程度。香农将这一概念引入信息论领域，提出了“信息熵”概念，通过对数函数来测量信息的不确定性。交叉熵（cross entropy）是信息论中的重要概念，主要用来度量两个概率分布间的差异。假定 p和 q是数据 x的两个概率分布，通过 q来表示 p的交叉熵可如下计算：

02

神经网络的压缩方法总结

我们知道，在一定程度上，网络越深，参数越多，模型越复杂，其最终效果越好。神经网络的压缩算法是，旨在将一个庞大而复杂的预训练模型（pre-trained model）转化为一个精简的小模型。按照压缩过程对网络结构的破坏程度，我们将模型压缩技术分为“前端压缩”和“后端压缩”两部分。

01

深度学习基础5:交叉熵损失函数、MSE、CTC损失适用于字识别语音等序列问题、Balanced L1 Loss适用于目标检测

深度学习基础5:交叉熵损失函数、MSE、CTC损失适用于字识别语音等序列问题、Balanced L1 Loss适用于目标检测

02

那些一键抠图的软件是怎么做到的？这些语义分割方法了解一下

在深度学习时代到来之前，大量的图像处理技术被用来将图像分割成一些感兴趣的区域（ROI）。下面列出了一些常用的方法。灰度分割这是最简单的语义分割形式，它包括将一个区硬编码的规则或某个区域必须满足的特定的标签属性赋予这个区域。可以根据像素的属性（如灰度值）来构建这样的规则。「分裂-合并」算法就是一种用到了灰度分割技术的方法。该算法递归地将图像划分成若干子区域，直到可以为划分出的子区域分配一个标签，然后通过合并将相邻的带有相同标签的子区域融合起来。该方法存在的问题是，规则必须是硬编码的。此外，仅使用灰度信息来表示复杂的类（比如人）是极其困难的。因此，需要特征提取和优化技术来恰当地学习这些复杂类所需的表征形式。

04

6种神经网络的压缩方法

我们知道，在一定程度上，网络越深，参数越多，模型越复杂，其最终效果越好。神经网络的压缩算法是，旨在将一个庞大而复杂的预训练模型（pre-trained model）转化为一个精简的小模型。按照压缩过程对网络结构的破坏程度，我们将模型压缩技术分为 “前端压缩” 和 “后端压缩” 两部分。

02

6种卷积神经网络压缩方法

来源：机器学习杂货店本文约5200字，建议阅读10+分钟我们知道，在一定程度上，网络越深，参数越多，模型越复杂，其最终效果越好。神经网络的压缩算法是，旨在将一个庞大而复杂的预训练模型（pre-trained model）转化为一个精简的小模型。按照压缩过程对网络结构的破坏程度，我们将模型压缩技术分为 “前端压缩” 和 “后端压缩” 两部分。前端压缩，是指在不改变原网络结构的压缩技术，主要包括知识蒸馏、轻量级网络（紧凑的模型结构设计）以及滤波器（filter）层面的剪枝（结构化剪枝）等；后端压缩，是

01

6 种卷积神经网络压缩方法

神经网络压缩算法是，旨在将一个庞大而复杂的预训练模型（pre-trained model）转化为一个精简的小模型。

01

解读 | 谷歌像素递归超分辨率研究：怎么消灭低分辨率图像马赛克？

机器之心原创作者：Angulia 参与：王灏、hustcxy、吴攀最近，谷歌发布了一种把低分辨率图像复原为高分辨率图像的方法，参见机器之心文章《学界 | 谷歌新论文提出像素递归超分辨率：利用神经网络消灭低分辨率图像马赛克》。与最先进的方法相比，这篇论文提出了一种端到端的框架来完成超分辨率任务。它由两个卷积神经网络组成，一个是描述低分辨率图像骨架的优先网络（prior network），一个是用于优化细节特征的调节网络（conditioning network）。这种方法强调了细节特征恢复上的提升，并以

09

交叉熵

上一篇译文《香农熵》中介绍了熵的由来及其计算公式的产生，这篇译文介绍另外一个与香农熵相关的概念：交叉熵（Cross-Entropy）

01

超越MobileNet V3 | 详解SkipNet+Bias Loss=轻量化模型新的里程碑

近年来，Compact卷积神经网络(CNNs)的性能有了显著的提高。然而，在参数众多的情况下，它们仍然无法提供与普通CNN相同的预测能力。这些层捕获的多样且丰富的特征是这些CNN的一个重要特征。

03

【数学基础】机器学习中的几个熵

相对熵又叫KL散度，也叫做信息增益，如果我们对于同一个随机变量，有两个单独的概率分布和，我们可以用KL散度来衡量这两个分布的差异。

01

CS231n：10 目标检测和分割

语义分割任务目标是输入一个图像，然后对每个像素都进行分类，如下图左，将一些像素分类为填空，一些分类为树等等。需要注意的是，语义分割单纯地对每个像素分类，因此不会区分同类目标，比如下图右边有两头牛，但是分类的结果中不会将两头牛区分开来，而是一视同仁，这也是语义分割的一个缺点。

01

大模型入门指南：基本技术原理与应用

随着计算能力的提升和数据量的增加，深度学习领域的大型神经网络模型（Big Model）在各种任务上取得了显著的性能提升，包括计算机视觉、自然语言处理、语音识别等。本文带着大家初步了解一下大模型的基本技术原理，包括深度神经网络、激活函数、损失函数、优化算法、正则化和模型结构等。

01

深度学习入门必看秘籍

导语：本文是日本东京 TensorFlow 聚会联合组织者 Hin Khor 所写的 TensorFlow 系列介绍文章，自称给出了关于 TensorFlow 的 gentlest 的介绍。第一部分引言我们要解决的是一个过于简单且不现实的问题，但其好的一面是便于我们了解机器学习和 TensorFlow 的概念。我们要预测一个基于单一特征（房间面积/平方米）的单标量输出（房价/美元）。这样做消除了处理多维数据的需要，使我们能够在 TensorFlow 中只专注于确定、实现以及训练模型。机器学习简介我

06

YOLO，一种简易快捷的目标检测算法

YOLO全称You Only Look Once，是一个十分容易构造目标检测算法，出自于CVPR2016关于目标检测的方向的一篇优秀论文（https://arxiv.org/abs/1506.02640 ），本文会对YOLO的思路进行总结并给出关键代码的分析，在介绍YOLO前，不妨先看看其所在的领域的发展历程。目标检测相对于传统的分类问题，目标检测显然更符合现实需求，因为往往现实中不可能在某一个场景只有一个物体（业务需求也很少会只要求分辨这是什么），但也因此目标检测的需求变得更为复杂，不仅仅要求de

04

确定不收藏？机器学习必备的分类损失函数速查手册

在监督式机器学习中，无论是回归问题还是分类问题，都少不了使用损失函数（Loss Function）。损失函数（Loss Function）是用来估量模型的预测值 f(x) 与真实值 y 的不一致程度。若损失函数很小，表明机器学习模型与数据真实分布很接近，则模型性能良好；若损失函数很大，表明机器学习模型与数据真实分布差别较大，则模型性能不佳。我们训练模型的主要任务就是使用优化方法来寻找损失函数最小化对应的模型参数。

00

玩转TensorFlow深度学习

导语：据介绍，Google Developers Codelabs 提供了有引导的、教程式的和上手式的编程体验。大多数 Codelabs 项目都能帮助你了解开发一个小应用或为一个已有的应用加入新功能的过程。这些应用涉及到很多主题，包括 Android Wear、Google Compute Engine、Project Tango、和 iOS 上的 Google API。本项目的原文可参阅：https://codelabs.developers.google.com/codelabs/cloud-tens

08

不是每张图都要高清，华为诺亚动态分辨率网络入选NeurIPS 2021

该论文指出识别每张图片所需要的最小分辨率是不同的，而现有方法并没有充分挖掘输入分辨率的冗余性，也就是说输入图片的分辨率不应该是固定的。论文进一步提出了一种动态分辨率网络 DRNet，其分辨率根据输入样本的内容动态决定。一个计算量可以忽略的分辨率预测器和我们所需要的图片分类网络一起优化训练。在推理过程中，每个输入分类网络的图像将被调整到分辨率预测器所预测的分辨率，以最大限度地减少整体计算负担。

01

Excel实现卷积神经网络

当你入门的时候，可能觉得机器学习很复杂……甚至很可怕。另一方面，电子表格却很简单。电子表格并不酷炫，但却能避免分散你的注意力，同时帮助你以直观的方式可视化代码后面发生的事情。

05

从零开始在Python中实现决策树算法

原文地址：https://machinelearningmastery.com/implement-decision-tree-algorithm-scratch-python/

06

How To Implement The Decision Tree Algorithm From Scratch In Python (从零开始在Python中实现决策树算法)

How To Implement The Decision Tree Algorithm From Scratch In Python 原文作者：Jason Brownlee 原文地址：https://machinelearningmastery.com/implement-decision-tree-algorithm-scratch-python/ 译者微博：@从流域到海域译者博客：blog.csdn.net/solo95 (译者注：本文涉及到的所有split point，绝大部分翻译成了

09

用Pytorch做深度学习（第一部分）

深度学习是机器学习的一个领域，利用大规模网络，海量数据集和在GPU（图形处理单元）上的加速运算。

02

关于深度学习你必须知道的几个信息理论概念

信息论是一个重要的领域，它对深度学习和人工智能作出了重大贡献，但很多人对它却并不了解。信息论可以看作是微积分、概率论和统计学这些深度学习基本组成部分的复杂融合。人工智能中的很多概念来自信息论或相关领域：

05

目标检测 | RetinaNet：Focal Loss for Dense Object Detection

目前state-of-the-art的目标检测算法大都是two-stage、proposal-driven的网络，如R-CNN架构。而one-stage检测器一直以速度为特色，在精度上始终不及two-stage检测器。因此，论文希望研究出一个精度能与two-stage检测器媲美的one-stage检测器

00

AAAI 2020 | 计算所&微信AI：改进训练目标，提升非自回归模型翻译质量（已开源）

本文是对计算所冯洋组和腾讯微信AI团队共同完成，被 AAAI2020 录用的论文《Minimizing the Bag-of-Ngrams Difference for Non-Autoregressive Neural Machine Translation》进行解读，相关工作已开源。

01

TensorFlow和深度学习入门教程

关键词：Python，tensorflow，深度学习，卷积神经网络正文如下：前言上月导师在组会上交我们用tensorflow写深度学习和卷积神经网络，并把其PPT的参考学习资料给了我们，这是codelabs上的教程：《TensorFlow and deep learning,without a PhD》 https://codelabs.developers.google.com/codelabs/cloud-tensorflow-mnist/#0 当然需要安装python，教程推荐使用pytho

06

神经网络如何学习的？

毫无疑问，神经网络是目前使用的最流行的机器学习技术。所以我认为了解神经网络如何学习是一件非常有意义的事。

02

CVPR 提前看：视觉常识的最新研究进展

1、What it Thinks is Important is Important: Robustness Transfers through Input Gradients

01

自然语言处理：语言模型与评价方法

假设一门语言中所有可能的句子服从某一个概率分布，每个句子出现的概率加起来为1，那么“语言模型”的任务就是预测每个句子在语言中出现的概率。对于语言中常见的句子，一个好的语言模型应得出相对较高的概率；而对于不合语法的句子，计算出的概率则应接近于零。把句子看成单词的序列，语言模型可以表示为一个计算p(w1,w2,w3,…,wm)的模型。语言模型仅仅对句子出现的概率进行建模，并不尝试去“理解”句子的内容含义。比如说，语言模型能告诉我们什么样的句子是常用句子，但无法告诉我们两句话的意思是否相似或者相反。

01

TensorFlow 文档:MNIST机器学习入门

MNIST机器学习入门博文 ID：机器学习和TensorFlow都不太了解的新手。如果你已经了解MNIST和softmax回归(softmax regression)的相关知识，你可以阅读这个快速上

02

【动手学深度学习】softmax回归从零开始实现的研究详情

启动jupyter notebook，使用新增的pytorch环境新建ipynb文件，为了检查环境配置是否合理，输入import torch以及torch.cuda.is_available() ，若返回TRUE则说明研究环境配置正确，若返回False但可以正确导入torch则说明pytorch配置成功，但研究运行是在CPU进行的，结果如下：

01

Advanced CNN Architectures（R-CNN系列）

除了将该图像标记为猫外，还需要定位图中的猫，典型方法是在该猫周围画一个边界框，这个方框可以看做定义该方框的一系列坐标，(x,y) 可以是方框的中心w 和 h 分别表示方框的宽和高。要计算这些值我们可以使用典型分类 CNN，用到的很多相同结构。

02

揭示相对熵和交叉熵的本质

在第4章4.4.3节介绍损失函数的时候，列出了几项常见的损失函数，其中就有神经网络中常用的以相对熵和交叉熵构建的损失函数。那么什么是相对熵和交叉熵呢？下面就分别进行介绍。

02

神探Sherlock如何用AI破案？教你在Excel中搭建一个人脸识别CNN网络

【导读】人脸识别技术已经有了非常广泛的应用，国内大规模监控系统背后运用的技术就是人脸识别。

02

[高大上的DL] Deep Learning中常用loss function损失函数的小结

在前面我们分享的如何来训练CNN中，提到了BP算法，还记得BP算法是怎么更新参数w，b的吗？当我们给网络一个输入，乘以w的初值，然后经过激活函数得到一个输出。然后根据输出值和label相减，得到一个差。然后根据差值做反向传播。这个差我们一般就叫做损失，而损失函数呢，就是损失的函数。Loss function = F(损失)，也就是F。下面我们说一下还有一个比较相似的概念，cost function。注意这里讲的cost function不是经济学中的成本函数。首先要说明的一点是，在机器学习和深度学习中，损

08

神经网络优化（损失函数：自定义损失函数、交叉熵、softmax()）

3、神经网络的层数，通常用神经网络的层数和神经网络待优化的参数的个数来表示，层数 = 隐藏层的层数 + 1个输出层，总参数 = 总W + 总b

02

DL | 语义分割综述

语义分割是计算机视觉中的基本任务，在语义分割中我们需要将视觉输入分为不同的语义可解释类别，「语义的可解释性」即分类类别在真实世界中是有意义的。例如，我们可能需要区分图像中属于汽车的所有像素，并把这些像素涂成蓝色。

02

一文弄懂各种loss function

有模型就要定义损失函数(又叫目标函数)，没有损失函数，模型就失去了优化的方向。大家往往接触的损失函数比较少，比如回归就是MSE，MAE，分类就是log loss，交叉熵。在各个模型中，目标函数往往都是不一样的，如下所示：

03

关于分类问题的一些学习

这几天的时间里看了一下关于分类算法的一些知识,趁热打铁写下博客来拯救下记忆力不好的自己,话不读多说,马上开始! 先说一下前提的题设条件.假设我们现在有了一封邮件,那么我们应该怎么根据这个邮件里的一些

05

干货 | 深度学习之损失函数与激活函数的选择

关键字全网搜索最新排名【机器学习算法】：排名第一【机器学习】：排名第二【Python】：排名第三【算法】：排名第四前言在深度神经网络（DNN）反向传播算法(BP)中，我们对DNN的前向反向传播算法的使用做了总结。其中使用的损失函数是均方差，而激活函数是Sigmoid。实际上DNN可以使用的损失函数和激活函数不少。这些损失函数和激活函数如何选择呢？以下是本文的内容。 MSE损失+Sigmoid激活函数的问题先来看看均方差+Sigmoid的组合有什么问题。回顾下Sigmoid激活函数的表达式为：

06

手撕CNN：综述论文详解卷积网络的数学本质

在该论文中，我们将从卷积架构、组成模块和传播过程等方面了解卷积网络的数学本质。读者可能对卷积网络具体的运算过程比较了解，入门读者也可先查看 Capsule 论文解读的第一部分了解详细的卷积过程，但其实我们一般并不会关注于卷积网络到底在数学上是如何实现的。因为各大深度学习框架都提供了简洁的卷积层API，所以我们不需要数学表达式也能构建各种各样的卷积层，我们最多只需要关注卷积运算输入与输出的张量维度是多少就行。这样虽然能完美地实现网络，但我们对卷积网络的数学本质和过程仍然不是太清楚，这也就是本论文的目的。

01

如果图灵是 AI 之父，那么香农应该是 AI 舅老爷？

标题有些危言耸听，前几天我们也写过图灵的八卦了，他被业界奉为「人工智能之父」毋庸置疑。

06

入门 | 一文了解什么是语义分割及常用的语义分割方法有哪些

人类是如何描述场景的？我们可能会说「窗户下有一张桌子」，或者「沙发右边有一盏灯」。图像理解的关键在于将一个整体场景分解成几个单独的实体，这也有助于我们推理目标的不同行为。

02

Rank & Sort Loss for Object Detection and Instance Segmentation

我们提出了秩和排序损失，作为一个基于秩的损失函数来训练深度目标检测和实例分割方法(即视觉检测器)。RS损失监督分类器，一个子网络的这些方法，以排名每一个积极高于所有的消极，以及排序积极之间关于。它们的连续本地化质量。为了解决排序和排序的不可微性，我们将错误驱动的更新和反向传播的结合重新表述为身份更新，这使我们能够在肯定的排序错误中建模。有了RS Loss，我们大大简化了训练:(I)由于我们的分类目标，在没有额外辅助头的情况下，由分类器对阳性进行优先排序(例如，对于中心度、IoU、掩码-IoU)，(ii)由于其基于排序的特性，RS Loss对类不平衡是鲁棒的，因此，不需要采样启发式，以及(iii)我们使用无调整任务平衡系数来解决视觉检测器的多任务特性。使用RS Loss，我们仅通过调整学习速率来训练七种不同的视觉检测器，并表明它始终优于基线:例如，我们的RS Loss在COCO数据集上提高了(I)Faster R-CNN约3框AP，在COCO数据集上提高了约2框AP的aLRP Loss(基于排名的基线)，(ii)在LVIS数据集上用重复因子采样(RFS)Mask R-CNN约3.5个屏蔽AP(稀有类约7个AP)；

02

[DeeplearningAI笔记]第一章2.1-2.4二分分类,logistic回归,梯度下降法

.就是你对 y 的预测,正式的说你希望 y 是一个预测的概率值.当输入特征 x 满足条件时,y 就是 1.你希望

03

TensorFlow和深度学习入门教程

前言上月导师在组会上交我们用tensorflow写深度学习和卷积神经网络，并把其PPT的参考学习资料给了我们，这是codelabs上的教程：《TensorFlow and deep learning,without a PhD》 https://codelabs.developers.google.com/codelabs/cloud-tensorflow-mnist/#0 当然需要安装python，教程推荐使用python3。好多专业词太难译了，查了下，大家有些都是不译的。比如：dropou

06

从业务角度理解深度学习及其应用

近几年，深度学习在图像、音频处理等领域得到了广泛的应用并取得了骄人的成绩，本文根据笔者的工作实践，谈谈对深度学习理解，以及我们的应用和经验。文章涉及的很多结论，是笔者个人的理解和不充分实验的结果，所以难免谬误，请读者不吝指正。机器学习就是学习对象的表示 “机器学习/深度学习模型依靠左右互搏，可以迅速达到很高的智能水准。”、“人工智能/深度学习能毁灭人类的奇点即将来到！” 网络上经常出现这类观点，让笔者非常惊讶。而让笔者更惊讶的是，很多人居然相信了。那么，什么是机器学习呢？机器学习的对象是我们生活中所接触

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭