我正在研究一种行人检测算法,我想使用INRIA数据集来测试它的准确性。dataset有两组包含正图像的测试文件夹。其中一个有裁剪版本,行人位于64×128像素窗口的中间。另一个文件夹包含未裁剪的版本,并为每个行人的边界框提供注释文件。如果我在注释文件中使用未裁剪的版本,那么如何说我的检测框是正确的,因为它可能没有与注释文件中的边界框值完全相同,但仍然准确地检测到了普通的值。如果我使用的裁剪版本,我仍然扫描图像或简单地提取中间64 x
所以我正在做的是用24张看起来像this的图片来训练它。在jTessBoxEditor的帮助下,选择了像this这样的盒子,每张图片有5个冠军和24张图片。但是,在执行以下代码时,结果并不十分准确,因为您可以看到here: File ImageFile = new File("image.png");String result = instan