我正在尝试评估我的视频对象检测模块,我正在使用InageNetΙ数据集来实现此目的。这意味着在这个帧中没有地面实况bboxes (这很好,因为我们正在讨论视频对象检测)。
因为我使用的模块要求至少有1bbox存在,所以我想知道ImageNet对这些情况的官方处理方法是什么。
评估指标与对象检测任务的评估指标相同,这意味着未注释的对象将受到惩罚,重复检测(同一对象实例的两个注释)也将受到惩罚。
它没有提到上面的情况场景。
此外,检查this repository的对象检测指标(顺便说一句,这是超解析的),没有gt的情况似乎落入了关于假阳性(FP)的一般情况。在本例中,交集将为0(因为不存在gt bbox ),Union将是一个等于FP bbox的非零数,因此为IoU = 0
。
发布于 2019-06-04 02:58:11
我刚刚浏览了ImageNet VID 2015评估代码,它是我从UNC的评估工具包中获得的。
评估涉及精度和召回率,因此需要为每个GT盒/检测对或实例计算TP、FP和FN。IoU计算纯粹用于确定是否发生了有效检测。
对于没有GT盒的帧,没有检测:因为我们没有记录真正的负片,所以这些对计算没有影响。
对于没有GT框的帧,但有一些检测:在eval_vid_detections.m
的第231行为每个帧捕获这些假阳性
if kmax > 0
tp(j) = 1;
gt_detected(kmax) = 1;
else
fp(j) = 1;
end
对于具有GT框但无检测的帧:当GT数据首次加载到第79:num_pos_per_class(c) = num_pos_per_class(c) + 1;
行时,将计数这些GT框。稍后在计算第266行的召回时将使用此参数:recall{c}=(tp/num_pos_per_class(c))';
因此,如果您的框架不包含检测和GT框,您可以放心地忽略它。
另外,请注意,每个实例的检测阈值设置如下:
thr = (gt_w.*gt_h)./((gt_w+pixelTolerance).*(gt_h+pixelTolerance));
gt_obj_thr{i} = min(defaultIOUthr,thr);
pixelTolerance = 10
在哪里。这给小对象带来了一些提振。
发布于 2020-05-29 16:46:25
如果本应具有GT注释的对象缺少注释,该如何处理呢?
例如,ILSVRC2015_val_00000001/000266.JPEG
显然有一个海龟(实际上,在000265.JPEG
之前,所有的帧都有对应的海龟注释),但是对应的注释文件ILSVRC2015_val_00000001/000266.xml
没有任何注释。
在我的分析中,在验证数据集中有来自176126
的4046
框架,它们缺少GT注释。这些框架中的大多数都没有GT注释,尽管其中包含一个属于ImageNetVID的30
类别的对象。
https://stackoverflow.com/questions/55844362
复制相似问题