官方DarkNet YOLO V3损失函数完结版

BBuf

发布于 2020-05-29 16:01:36

1.6K0

发布于 2020-05-29 16:01:36

文章被收录于专栏：GiantPandaCV

1. 前言

有了前面两篇文章的铺垫，基本上YOLOV3的损失函数就比较明确了。然后在上一节还存在一个表述错误，那就是在坐标损失中针对bbox的宽度和高度仍然是MSE Loss，而针对bbox的左上角坐标，的损失则是我们YOLOV3损失函数再思考 Plus 推出来的BCE Loss。接下来我就完整的写一下根据DarkNet官方源码推出来的YOLOV3的Loss。

2. DarkNet YOLOV3 Loss

直接写出公式，注意带*号的变量代表预测值，不带*号的表示标签：

我们再来解释一下这个公式。

在YOLOV3中，Loss分成三个部分：

一个是目标框位置（左上角和长宽）带来的误差，也即是box带来的loss。而在box带来的loss中又分为,带来的BCE Loss以及,带来的MSE Loss。
一个是目标置信度带来的误差，也就是obj带来的loss（BCE Loss）。
最后一个是类别带来的误差，也就是class带来的loss（类别数个BCE Loss）。

另外值得注意的一个点是网上大多数博客写这个损失的时候都加了，,参数，但我们打开「YOLOV3.cfg」发现，原版的YOLOV3中并没有这几个参数，并且代码中也没有体现，所以正确的公式应当去掉这几个参数。

yolov3.cfg

3. 答读者问

下面选几个留言区里面读者的问题来回答一下。

3.1 来自kun

Q: 如果坐标中心点用BCE Loss的话，那么是怎么设置标签呢，BCE 的标签不是0或者1吗？A: 首先YOLOV3没有中心点一说，只有左上角的点。那么它是怎么设置标签呢？首先在YOLOV2/V3里面引入了一个直接坐标预测的概念，可以看看下面的几个图片：

】

图3

从图2可以看出，最终得到的边框坐标值是bx,by,bw,bh,即边界框相对于特征图的位置和大小，是我们需要预测的输出坐标值。但是，网络实际上学习的东西是(这和损失函数公式里面的一致，前面已经说明)，其中「tx,ty是预测的坐标偏移值，tw,th是尺度缩放」，有了这个偏移量自然可以根据前面的公式计算出真正的这4个坐标。

我们现在可以正面解答这位同学的问题了，标签该怎么设置呢？「BCE 的标签不是0或者1？」 在二分类问题并且使用One-Hot编码的情况下确实是这样的，「但是我们这里并不是分类」，我们要做的是预测出来的偏移值靠近原始的GT相对于于的偏移值，所以这个标签就是提前算好，代码如下：