首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

yolo 实例分割_jacobi椭圆函数

我们提出了一个简单的、完全卷积的实时实例分割模型,在MS-COCO上达到29.8map,在单个Titan Xp上以33.5fps的速度进行评估,这比以往任何竞争方法都要快得多。而且,我们只在一个GPU上训练就得到了这个结果。我们通过将实例分割分成两个子任务来实现这一点:(1)生成一组原型掩码;(2)预测每个实例的掩码系数。然后,我们通过将原型与掩码系数结合起来,生成实例masksby。我们发现,由于这个过程不依赖于再冷却,这种方法产生了非常高质量的掩模,并免费展示了时间稳定性。此外,我们还分析了原型的涌现行为,并展示了它们在完全卷积的情况下,以一种翻译变体的方式学会了自己定位实例。最后,我们还提出了快速NMS,它比仅具有边际性能损失的标准NMS快12 ms。

04

轻松生产短视频——腾讯多媒体实验室横屏转竖屏技术

腾讯多媒体技术专栏 伴随手机等智能设备的广泛使用以及短视频平台的兴起,越来越多的“竖屏”视频开始占据人们的视野。目前,许多“竖屏”视频仍是由16:9等宽高比的“横屏”视频剪辑而成,然而传统的静态裁剪和补充黑边等视频宽高比转换算法已经不能满足用户对横屏到竖屏的内容转换需求。对此,多媒体实验室“智媒”平台提出了一种基于显著性的视频裁剪方法,它可以根据视频的内容实现横屏到竖屏的自动裁剪。与竞品相比,本文方法可以获得更智能、更稳定的裁剪结果。 1、背景 1.1背景介绍 快速发展的智能传感器和多媒体技术让人们

04

Scalable Object Detection using Deep Neural Networks

深度卷积神经网络最近在一系列图像识别基准测试中取得了最先进的性能,包括ImageNet大规模视觉识别挑战(ILSVRC-2012)。在定位子任务中获胜的模型是一个网络,它预测一个边界框和图像中每个目标类别的置信度得分。这样的模型捕获目标周围的整个图像上下文,但是如果不天真地复制每个实例的输出数量,就不能处理图像中相同目标的多个实例。在这项工作中,我们提出了一个显著性激发的神经网络模型用于检测,它预测了一组与类无关的边界框,以及每个框的一个得分,对应于它包含任何感兴趣的目标的可能性。模型自然地为每个类处理可变数量的实例,并允许在网络的最高级别进行跨类泛化。我们能够在VOC2007和ILSVRC2012上获得具有竞争力的识别性能,同时只使用每张图像中预测的前几个位置和少量的神经网络评估。

02
领券