首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

SFFAI分享 | 张志鹏:SiamDW Real-Time Visual Tracking【附PPT与视频资料】

目标跟踪是计算机视觉的基本任务之一,近年来随着大量跟踪数据库如OTB,VOT,LASOT,GOT10K的提出,以及VOT比赛的推广,单目标跟踪领域迅速发展。而这其中siamese跟踪算法由于其在速度和精度之间很好的平衡而逐渐成为单目标跟踪研究中最火的方向。然而在今年之前,siamese跟踪算法仍然是只是基于浅层的AlexNet,深层网络不但没有帮助反而会使效果下降。在CVPR19中,我们通过对网络结构属性的分析,提出网络padding, 感受野, 特征输出大小,stride是影响加深网络的关键。进而我们提出了适用于跟踪siamese网络的crop-in-residual模块,通过堆积模块加深网络,使深层siamese网络在跟踪上效果有了显著提高。本次分享会上我们:

02

计算机视觉最新进展概览2021年11月7日到2021年11月13日

由于动态环境中激光雷达点的稀疏性,点云中的三维目标跟踪仍然是一个具有挑战性的问题。在本文中,我们提出了一种voxel-to-BEV跟踪器,它可以显著提高稀疏三维点云的跟踪性能。具体来说,它由Siamese形状感知特征学习网络和voxel-to-BEV目标定位网络组成。Siamese形状感知特征学习网络可以获取目标的三维形状信息,学习目标的判别特征,从而识别出稀疏点云背景中的潜在目标。为此,我们首先进行模板特征嵌入,将模板的特征嵌入到潜在目标中,然后生成密集的三维形状来表征潜在目标的形状信息。对于跟踪目标的定位,体素-BEV目标定位网络以无锚的方式将目标的二维中心和z轴中心从稠密鸟瞰(稠密鸟瞰)特征地图上回归。具体来说,我们通过最大池化将体素化后的点云沿z轴压缩,得到稠密的BEV特征图,可以更有效地进行二维中心与z轴中心的回归。对KITTI和nuScenes数据集的广泛评价表明,我们的方法明显优于目前最先进的方法。

02

CVPR:深度无监督跟踪

本文提出了一种无监督的视觉跟踪方法。与使用大量带注释数据进行监督学习的现有方法不同,本文的CNN模型是在无监督的大规模无标签视频上进行训练的。动机是,强大的跟踪器在向前和向后预测中均应有效(即,跟踪器可以在连续帧中向前定位目标对象,并在第一个帧中回溯到其初始位置)。在Siameses相关过滤器网络上构建框架,该网络使用未标记的原始视频进行训练。同时提出了一种多帧验证方法和一种对成本敏感的损失,以促进无监督学习。由于没有bells & whistles,本文的无监督跟踪器可达到完全受监督的在训练过程中需要完整且准确的标签的跟踪器的基线精度。此外,无监督框架在利用未标记或标记较弱的数据以进一步提高跟踪准确性方面具有潜力。

03

[Extensive Reading]SOT:SiameseRPN

SiameseRPN:High Performance Visual Tracking with Siamese Region Proposal Network SiameseFC成功使用孪生网络成功解决SOT问题,虽然它不是真正意义上的第一个使用Siamese结果的SOT算法,但是SiameseFC之于SOT,就像SORT之于MOT,RCNN之于目标检测,甚至AlexNet之于CNN一样。 但是SiameseFC有一个致命的问题,无法适应尺度变化。就像最早的目标检测一样,当不是用SS做区域建议时,怎么解决目标尺度变化的问题:Faster R-CNN的RPN; SiameseRPN就是在SiameseFC的基础上引入PPN,处理SOT中的目标尺度变化; SiameseRPN用的是和SiameseFC非常相似的主干网络,最后输出的厚度不同,SiameseFC为128,SiameseRPN为256,同样no padding; SiameseRPN相比于SiamFC,精度更高,速度更快(160fps:86fps),速度快是因为SiameseRPN不需要多尺度;

02
领券