首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Dynamic Anchor Learning for Arbitrary-Oriented Object Detection

    任意方向的目标广泛出现在自然场景、航拍照片、遥感图像等,任意方向的目标检测受到了广泛的关注。目前许多旋转检测器使用大量不同方向的锚点来实现与ground truth框的空间对齐。然后应用交叉-联合(IoU)方法对正面和负面的候选样本进行训练。但是我们观察到,选择的正锚点回归后并不能总是保证准确的检测,而一些阴性样本可以实现准确的定位。这说明通过IoU对锚的质量进行评估是不恰当的,进而导致分类置信度与定位精度不一致。本文提出了一种动态锚学习(DAL)方法,利用新定义的匹配度综合评价锚的定位潜力,进行更有效的标签分配过程。这样,检测器可以动态选择高质量的锚点,实现对目标的准确检测,缓解分类与回归的分歧。在新引入的DAL中,我们只需要少量的水平锚点就可以实现对任意方向目标的优越检测性能。在三个遥感数据集HRSC2016、DOTA、UCAS-AOD以及一个场景文本数据集ICDAR 2015上的实验结果表明,与基线模型相比,我们的方法取得了实质性的改进。此外,我们的方法对于使用水平边界盒的目标检测也是通用的。

    01

    IENet: Interacting Embranchment One Stage Anchor Free Detector

    航空图像中的目标检测是一项具有挑战性的任务,因为它缺乏可见的特征和目标的不同方向。目前,大量基于R-CNN框架的检测器在通过水平边界盒(HBB)和定向边界盒(OBB)预测目标方面取得了显著进展。然而,单级无锚解仍然存在开放空间。提出了一种基于逐像素预测检测器的航空图像定向目标单级无锚检测器。我们通过开发一个具有自我注意机制的分支交互模块来融合来自分类和框回归分支的特征,从而使它成为可能。在角度预测中采用几何变换,使预测网络更易于管理。我们还引入了一种比正多边形借条更有效的借条损耗来检测OBB。在DOTA和HRSC2016数据集上对所提出的方法进行了评估,结果表明,与最先进的检测器相比,我们所提出的IENet具有更高的OBB检测性能。

    01

    Stereo R-CNN based 3D Object Detection for Autonomous Driving

    提出了一种充分利用立体图像中稀疏、密集、语义和几何信息的自主驾驶三维目标检测方法。我们的方法,称为Stereo R-CNN,扩展了Faster R-CNN的立体输入,以同时检测和关联目标的左右图像。我们在立体区域建议网络(RPN)之后添加额外的分支来预测稀疏的关键点、视点和目标维数,并结合二维左右框来计算粗略的三维目标边界框。然后,我们恢复准确的三维包围框,以区域为基础的光度比对使用左和右ROI。我们的方法不需要深度输入和三维位置监督,但是,优于所有现有的完全监督的基于图像的方法。在具有挑战性的KITTI数据集上的实验表明,我们的方法在三维检测和三维定位任务上都比目前最先进的基于立体的方法高出30%左右的AP。

    02

    U-Net: Convolutional Networks for Biomedical Image Segmentation

    人们普遍认为,深度网络的成功训练需要数千个带注释的训练样本。在本文中,我们提出了一种网络和训练策略,它依赖于数据扩充的强大使用,以更有效地使用可用的带注释的样本。该体系结构由捕获上下文的收缩路径和支持精确定位的对称扩展路径组成。我们证明这样的网络可以从非常少的图像端到端的训练,并且在ISBI挑战中在电子显微镜栈中神经结构的分割上胜过先前的最佳方法(滑动窗口卷积网络)。我们使用相同的网络训练透射光学显微镜图像(相位对比和DIC),在2015年ISBI细胞跟踪挑战赛中,我们在这些类别中获得了巨大的优势。此外,网络速度很快。在最近的GPU上,512x512图像的分割需要不到一秒的时间。

    03

    A Comparison of Super-Resolution and Nearest Neighbors Interpolation

    随着机器视觉和深度卷积神经网络(CNNs)被应用于新的问题和数据,网络架构的进步和这些网络的应用都得到了快速的发展。然而,在大多数分类和目标检测应用中,图像数据是这样的,感兴趣的对象相对于场景来说是很大的。这可以在最流行的公共基准数据集ImageNet、VOC、COCO和CIFAR中观察到。这些数据集和它们对应的挑战赛继续推进网络架构比如SqueezeNets, Squeeze-and-Excitation Networks, 和 Faster R-CNN。对于DigitalGlobe的WorldView-3卫星将每个像素表示为30平方厘米的区域的卫星数据。在这些场景中,在大于3000x3000的场景中像汽车这样的物体通常是13x7像素或更小。这些大型场景需要预处理,以便在现代目标检测网络中使用,包括将原始场景切割成更小的组件用于训练和验证。除此之外,在停车场和繁忙的道路等区域,车辆等物体往往位于较近的位置,这使得车辆之间的边界在卫星图像中难以感知。缺乏公共可用的标记数据也阻碍了对这个应用程序空间的探索,只有xView Challenge数据集拥有卫星捕获的带有标记对象的图像。等空中数据集分类细粒度特性在空中图像(COFGA),大规模数据集在空中图像(队伍),对象检测和汽车开销与上下文(COWC)也有类似的对象类,但存在一个较低的地面样本距离(德牧)使他们更容易获得良好的对象检测结果,但限制了实际应用。考虑到将CNNs应用于卫星数据所面临的挑战,将升级作为预处理步骤对实现准确探测目标的良好性能至关重要。深度学习的进步导致了许多先进的体系结构可以执行升级,在低分辨率图像上训练网络,并与高分辨率副本进行对比验证。尽管关于这一主题的文献越来越多,但超分辨率(SR)在目标检测和分类问题上的应用在很大程度上还没有得到探索,SR与最近邻(NN)插值等也没有文献记载。SR网络作为卫星图像中目标检测的预处理步骤,具有良好的应用前景,但由于其深度网络包含数百万个必须正确训练的参数,因此增加了大量的计算成本。与SR不同的是,NN仍然是最基本的向上缩放方法之一,它通过取相邻像素并假设其值来执行插值,从而创建分段阶跃函数逼近,且计算成本很小。

    03

    哈佛商业评论:如果中央银行发行数字货币会怎样?

    概要。货币已经是数字化的,而且已经存在多年了。但银行业的基本模式在很大程度上没有改变。这是因为该系统基于这样一种概念,即商业银行发行的数字货币可以转换为纸币现金,而纸币是中央银行的负债。本文探讨了如果中央银行开始直接发行数字货币会发生什么,这正是中国和其他国家目前正在探索的。金融科技专家 Ajay S. Mookerjee 认为这将颠覆传统银行体系。他认为,转向中央银行数字货币 (CBDC) 对储户来说会更安全(因为 CBDC 是发行机构中央银行的直接负债,而不是商业银行的负债),这将消除商业银行直接从消费者和家庭那里吸收存款的需要,这也使银行业的大部分物理基础设施变得多余,这也使得能够更有效地监控和监管金融体系,并更具包容性。仅在美国,每年可节省的成本就达到 7500 亿美元,与该国家庭在食品上的支出一样多。

    01
    领券