首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Sub-Category Optimization for Multi-View Multi-Pose Object Detection

    外观变化大的目标类别检测是计算机视觉领域的一个基本问题。由于类内部的可变性、视角和照明,目标类别的外观可能会发生变化。对于外观变化较大的目标类别,需要使用基于子类别的方法。本文提出了一种基于外观变化自动将一个目标类别划分成适当数量的子类别的子类别优化方法。我们没有使用基于领域知识或验证数据集的预定义的类内子分类,而是使用基于鉴别图像特征的非监督聚类来划分样本空间。然后利用子类别判别分析验证了聚类性能。基于无监督方法的聚类性能和子类别判别分析结果,确定了每个目标类别的最优子类别数。大量的实验结果显示使用两个标准和作者自己的数据库。比较结果表明,我们的方法优于最先进的方法。

    04

    北大提出PKU FG-XMedia:细粒度跨媒体检索数据集和评测基准

    跨媒体检索(Cross-media Retrieval)是指用户给定任意一种媒体类型数据作为查询样例,系统检索得到与查询样例相关的各种媒体数据。如图 1 所示,当用户给定一张灰背鸥(Slaty-backed Gull)的图像作为查询样例,检索结果包含了图像、文本、视频和音频 4 种媒体数据。现有跨媒体检索研究一般聚焦在粗粒度跨媒体检索(Coarse-grained Cross-media Retrieval),只是将灰背鸥的图像作为鸟的图像进行分析检索,因此检索结果中会包含各种相似鸟类的媒体数据(如灰翅鸥、银鸥、加州海鸥等),而不是灰背鸥的图像、文本、视频和音频数据,如图 1(a) 所示。为了克服上述问题,本文提出了细粒度跨媒体检索(Fine-grained Cross-media Retrieval),即用户给定任意一种媒体类型数据作为查询样例,系统检索得到与查询样例细粒度类别相同的各种媒体数据,如图 1(b) 所示,检索得到灰背鸥的图像、文本、视频和音频数据。

    02
    领券