0x01 目标检测
----
目标检测做的是检测出图像上哪些区域有我们关注的什么类别的目标,从这个理解上,任务就是分成两个步骤的:
检测出图像的哪些区域有目标;
对这些目标做分类。...从我们的经验来说,目标检测应该也是分成两个步骤的,就像我们在地上找一个纽扣一样:
先粗略看地面上有哪些区域可能有类似纽扣的;
再凑近点看看,这个区域是否真的有纽扣。...对于目标检测,对于每个目标我期待的输出是:
(x, y, w, h, p1, p2, ..., pk)
其中(x, y)是目标中心点,(w, h)是目标box的宽高,而(p1, p2, ..., pk)...而bbox的宽高计算则简单一些(w/img_w, h/img_h),对应除以图像的宽高即可。
bbox是否有对象的置信度自然都是1了,后面的类别概率就是(p1, p2, ..., p20)。...这个损失函数的定义很好理解,比较技巧性的地方我看有两个:
置信度的损失拆成了两个部分,对于没有目标的部分前面乘了一个超参数,在作者的论文里,该值是一个小于0的值,显然是要降低这部分的影响。