展开

关键词

OpenCV:

OpenCV可以的主要特征,然后提取的特征,使其成为描述符。这些特征,也就是描述符,可以作为的数据库。个人感觉就是,和「以」有点。? 测和提取的工作做完了,就是特征匹配。主要是「暴力匹配法」和「FLANN匹配法」。提了好几次特征了,那么什么是的特征呢? 「SIFT」则是一种与比例无关的角点测方法,尺度不变特征变换。采用DoG和SIFT来测关键点并提取关键点周围的特征。 「SURF」特征测算法,则是采用Hessian算法测关键点,使用SURF提取特征。剩下的太难了,以后慢慢了解~ 02 采用FLANN匹配,近似最近邻的快速库。 可以看到原始片上的logo和目标片上的logo匹配上了。也就意味着,我们能够利用原始片(微博logo)从一个包含目标片的片库里到目标片(包含微博logo)。以,这还是很相似的。

34920

:基于内容的技术(三)

大规模特点无论是对于相同物体还是相同类别,在大规模数据集上,它们具有三个典型的主要特征:数据量大、特征维度高以及要求相应时间短。 得益于多媒体信息捕获、传输、存储的发展以及计算机运算速度的提升,基于内容的技术经过十几年的发展,其需要适用的规模范围也从原来的小型库扩大到大规模库甚至是海量数据集,比如在上世纪九十年代技术发展的早期阶段 ,研究者们在验证算法性能的时候,用得比较多是corel1k,该库共1000张片,与今天同样可以用于的最流行的分类库imageNet数据集相比,其量级已经有了成千上万倍的增长,因而应满足大数据时代的要求 特征作为直接描述视觉内容的基石,其特征表达的好坏直接决定了在过程中可能达到的最高精度。 、基于哈希的方法和基于向量量化的方法。

1.2K10
  • 广告
    关闭

    90+款云产品免费体验

    提供包括云服务器,云数据库在内的90+款云计算产品。打造一站式的云产品试用服务,助力开发者和企业零门槛上云。

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    :基于内容的技术(一)

    针对这些包含丰富视觉信息的海量片,如何在这些浩瀚的库中方便、快速、准确地查询并到用户所需的或感兴趣的,成为多媒体信息领域研究的热点。 经过十来来的发展,基于内容的技术已广泛应用于搜引擎、电子商务、医学、纺织业、皮革业等生活的方方面面。 按描述内容方式的不同可以分为两类,一类是基于文本的(TBIR, Text Based Image Retrieval),另一类是基于内容的(CBIR, Content Based 随着数据快速增长,针对基于文本的方法日益凸现的问题,在1992年美国国家科学基金会就数据库管理系统新发展方向达成一致共识,即表示信息的最有效方式应该是基于内容自身的。 基于内容的技术将内容的表达和相似性度量交给计算机进行自动的处理,克服了采用文本进行所面临的缺陷,并且充分发挥了计算机长于计算的优势,大大提高了的效率,从而为海量库的开启了新的大门

    1.5K20

    :基于内容的技术(二)

    基于内容的技术?相同物体相同物体是指对查询中的某一物体,从库中找出包含有该物体的。 如1.3所示,给定一幅”蒙娜丽莎”的画,相同物体的目标就是要从库中出那些包含有”蒙娜丽莎”人物的片,在经过相似性度量排序后这些包含有”蒙娜丽莎”人物的片尽可能的排在结果的前面。 相同类别对给定的查询片,相似的目标是从库中查找出那些与给定查询属于同一类别的。 相同类别目前已广泛应用于引擎,医学影等领域。对于相同类别,面临的主要问题是属于同一类别的类内变化巨大,而不同类的类间差异小。 ,能够降低的维度还是有限的,因而对于这一类,同样有必要为它构建够高效合理的快速机制,使其适应大规模或海量

    43730

    :基于内容的技术(四)

    基于树的方法将对应的特征以树结构的方法组织起来,使得在的时候其计算复杂度降到关于库样本数目n的对数的复杂度。基于树结构的搜方法有KD-树8、M-树9等。 此外,基于树结构的方法在构建树结构的时候其占用的存储空间往往要比原来的数据大得多,并且对数据分布敏感,从而使得基于树结构的方法在大规模数据库上也会面临内存受限的问题。 相比基于树结构的方法,基于哈希的方法由于能够将原特征编码成紧致的二值哈希码,使得基于哈希的方法能够大幅的降低内存的消耗,并且由于在计算汉明距离的时候可以使用计算机内部运算器具有的 基于哈希的方法其关键之处在于设计一个有效的哈希函数集,使得原空间中的数据经过该哈希函数集映射后,在汉明空间其数据间的相似性能够得到较好的保持或增强。 在面向大规模时,除了采用哈希方法外,还有另一类方法,即向量量化的方法,向量量化的方法中比较典型的代表是乘积量化(PQ, Product Quantization)方法,它将特征空间分解为多个低维子空间的笛卡尔乘积

    51810

    - 评价指标

    评价指标1. Precision & Recall & F-Score----image.png 2. AP & mAPimage.png----一个很好的片概括: ?

    1.1K20

    】CBIR资料汇总

    hashing-baseline-for-image-retrievalReferenceCode: sift-match-with-ransacReferenceCode: py-cbir-image-search-engine用Simese网络判断两张的相似度 Retrieval简要介绍CBIR系统流程 Deep Image Retrieval: Learning global representations for image search(很有意思,包括了目标测和 )基于多层 CNN 特征的技术Paper: awesome-cbir-papersPaper: Three things everyone should know to improve object

    87030

    VLAD算法简介

    基础概念VLAD是vector of locally aggregated descriptors的简称,是由Jegou et al.在2010年提出,其核心思想是aggregated(积聚),主要应用于领域 1.2 相关方法优缺点在深度学习时代之前,领域以及分类主要使用的常规算法有BoW、Fisher Vector及VLAD等。 (GMM),通过计算高斯混合模型中的均值、协方差等参数来表示每张。 1.3 VLAD算法VLAD算法可以看做是一种简化的FV,其主要方法是通过聚类方法训练一个小的码本,对于每幅中的特征找到最近的码本聚类中心,随后所有特征与聚类中心的差值做累加,得到一个k*d的vlad 后,使用ADC方法继续降低储存空间和提高搜速度其中步骤4、5可选,在步骤3得到残差累加向量后进行L2归一化即可用欧氏距离等计算两张片的相似性从而实现一个简单的实现(基于sift特征及orb特征

    84930

    tf40:(triplet_loss)之Conditional Similarity Networks

    下面是原理,具体细节可以看论文,我的TF实现:https:github.comMachineLPconditional-similarity-networks-Tensorflow?

    42720

    (一):因缘际会与前瞻

    之前因为学习Keras的缘故,看到一个的Demo,代码实现了输入一张查询照片,出最相似的n张照片的效果。? 示例进而用t-SNE将所有照片降至2维,以便可视化并观察相似照片是否聚集到了一起。 你可能又会好奇,标题不是说好了介绍的嘛,怎么又扯到深度学习上了,到底是如何实现出相似,如何用t-SNE对海量进行可视化的呢?这其中的缘故,且听我慢慢道来。 那么原本用于识别,比如识别一张里到底是猫还是狗的卷积神经网络,又是结合到上的呢? 类似流程大致如下,相关阅读:《基于deep learning的快速系统》: ?

    31920

    基于SIFT特征的 vs CNN

    下面简单的对比一下sift和cnn的结果:(基于此改进的版本好多:各种sift;cnn(vgg-fc3;vgg(resnet、inception等)-conv;)+PCA等,各种特征融合等等)库 sift结果:????cnn结果:原:? :?原:? :?原: ?:?原:? :? KMeansfrom matplotlib import pyplot as plt# get_ipython().magic(matplotlib inline) # ### 基于SIFT,BOW的 # #### 1、SIFT提取每幅的特征点# #### 2、聚类获取视觉单词中心(聚类中心),构造视觉单词词典# #### 3、将特征点映射到视觉单词上,得到特征# #### 4、计算待的最近邻 ,img_dataset,centures,img_paths): ,找出最的几个 img:待 img_dataset:数据库 matrix num_close:显示最近邻的数目

    40220

    系列——利用 Python 相似度

    前言最近在做一个海量的项目,可以简单的理解为“以”,这个功能一开始是搜引擎带火的,但是后来在电商领域变得非常实用。 在制作这个的项目前,笔者搜了一些资料,如今项目临近结尾,便在这里做一些简单的分享。本文先介绍最基础的一部分知识——利用 Python 相似度。 这种方法对于寻找一模一样的片是有效的,但是搜「相似片」的效果很差,也不能局部搜,因此通常应用在「片是否侵权」上。 现在诸如谷歌识、百度识几乎都是采用深度学习的方式进行相似性,这个下篇文章介绍。为什么余弦相似度不适合用来片相似度最后我们来讨论下为什么不使用余弦相似度来片的相似度。 想要制作一个系统虽然第一步都是比较的相似度,但现如今大多数都是通过深度学习的方法提取出特征,然后再进行比较,准确率大大提升。

    2.9K30

    【CV实践】从入门到进阶

    Datawhale分享作者:阿水,Datawhale成员简介:阿水,Datawhale成员,北京航空航天大学硕士,多次获得国内外数据竞赛TOP名次是计算机视觉中基础的应用,可分为文字搜和以 借助于卷积神经网络CNN强大的建模能力,的精度越发提高。本次分享,将会从基础分享的原理和流程,并具体讲解局部特征和全局特征的差异性,最后以比赛为案例,进行独家的分享。 入门介绍的定义、的典型应用和流程2. 特征 介绍全局特征和局部特征,进而过程3. 案例 以的应用和竞赛为案例,讲解解决方案入门? 文字与内容 ?CBIR 应用场景 ?成熟的应用涉及到相关算法,也是一个工程问题?的本质是特征提取和相似度计算的过程?特征?即使相差万里的也有可能是相似的? 如果相似,则特征也相似?局部特征与全局特征 ?简易代码示例?相似度计算 ?词袋模型?案例?????????总结?

    35820

    】【TPAMI重磅综述】 SIFT与CNN的碰撞:万字长文回顾任务十年探历程

    这些缺陷也导致了准确率的低下,也局限了全局描述符算法的应用范围。恰在这时,基于局部特征的算法给解决这一问题带来了曙光。本篇综述主要关注于实例级的任务。 3 基于SIFT特征的系统3.1 基本流程基于SIFT特征与CNN特征的流程如2所示。?2:基于SIFT特征与CNN特征的流程局部特征提取。假设我们有一个含? 4 基于CNN的系统基于CNN的方法近年来不断被提出,并且在逐渐取代基于手工测器和描述符的方法。 这些方法将原始作为输入,并在二值化之前生成学习的特征。然而,这些方法大多集中于分类式的任务,与本次调研所中讨论的实例不同。 7:特征维度对系统准确率的影响?表6:不同类别方法间的效率和准确度的比较另一方面,基于CNN的模型在中迅速显示出其优势。

    3K11

    中的DELF模型(DEep Local Features)实践

    模式的是CBIR(基于内容的)任务中最难的一块,其中由于拍摄角度的不同,有些片只显示了局部信息,有些则有全局信息,在这种情况下的匹配的效果,以往算法都表现一般。 ,具体而言他是一种基于中对象instance的匹配。 1、DELF的架构(实现流程)如下的流程可见,对于任何,需要获得特征,此处采用CNN架构来实现特征的抽取,其中DELF抽取的步骤如左所示,主要区别是有个注意力的得分判断模型。 作者直接在高层的语义上进行关键点测,而不是在原测。这也是为什么需要用到tensorflow 的object_detect包的原因。 匹配,这一步就超级快了。?实验结果?为了丰富实验,以中国澳门著名景点再进行实验,一个取正面,一个以侧面如下所示:???从上面可以看出,这个效果还是相当好的。

    1.4K30

    机器学习 | 开源项目合集

    、Lire基于内容的视觉信息库。 目前我主要致力于大规模研究,在中除了专注与duplicate search外我也花很大力气在哈希大规模上。在研究的过程中,我发觉几乎很少有研究者提供不同对比方法的代码。 从用于分类的深度神经网络的最后一个卷积层提取和聚合的特征已被证明是用于各种任务的有用的描述符,如迁移学习和。在基于内容的中,通常会将视觉上相似的聚类在该特征空间中。 本项目通过视觉级别搜,细粒度类别(实例)和-文本互搜的方式来测试通用多媒体。 Mirror是用于3D重建和相关应用程序的可匹配管道。与典型的对象不同,可匹配的旨在查找重叠度大的相似

    46051

    基于内容的技术:从特征到

    二、基于内容的流程内容流程与文本流程类似,但二者信息表征方法不同。文本通过词频计算BoW来表征一段文本内容,而则使用视觉特征来表示。 Video-Google中系统也分为构建词库、构建引和三部分。下是视觉词库构建流程:?对提取若干个局部特征描述子,如sift,对这些描述子进行量化。 基础得到的视觉词库,计算所有(或视频中帧)数据的BoVW向量。进程启动时,将目标数据库中所有的BoVW向量构建引。 时,只需要计算那些与当前查询包含相同单词的的BoVW向量间的距离即可,即通过减小搜范围来降低搜复杂度。 2015年的这篇论文调研和评估了应用于时,各种特征聚合方法作用于深度卷积特征得到的全局特征表示。

    16110

    用Python实现OpenCV特征提取与 | Demo

    其实这些技术都离不开最基本的技术。本篇文章我们就将对这一技术的原理进行介绍,并通过一个简单的Python脚本来实现一个最基本的demo。 首先,程序会用extract_features上的关键点(局部模式的中心点)。 batch_extractor是在所有的中批量运行特征提取器,并将特征向量保存在pickled文件中以供后续使用。现在我们来建立类Matcher,它会将待搜和数据库中的进行匹配。 def cos_cdist(self, vector): # getting cosine distance between search image and images database #计算待搜与数据库的余弦距离 当然,这仅仅是一个demo,在实际计算中,还可以用一些算法来快速计算数百万间的余弦距离。你可以使用简单且运行速度相当快的Annoy Index(在1M中搜约需2ms)。

    1.8K30

    OpenCV特征提取与实现(附代码)

    其实这些技术都离不开最基本的技术。本篇文章我们就将对这一技术的原理进行介绍,并通过一个简单的Python脚本来实现一个最基本的demo。 首先,程序会用extract_features上的关键点(局部模式的中心点)。 batch_extractor是在所有的中批量运行特征提取器,并将特征向量保存在pickled文件中以供后续使用。现在我们来建立类Matcher,它会将待搜和数据库中的进行匹配。 def cos_cdist(self, vector): # getting cosine distance between search image and images database #计算待搜与数据库的余弦距离 当然,这仅仅是一个demo,在实际计算中,还可以用一些算法来快速计算数百万间的余弦距离。你可以使用简单且运行速度相当快的Annoy Index(在1M中搜约需2ms)。

    1.7K60

    深度离散哈希算法,可用于

    由于网络上的和视频数据的快速增长,哈希算法(Hashing)在近几年间引起了极大的关注。由于其较低的计算成本和较高的存储效率,是和视频搜中最常使用的技术之一。 「CNNH」 是早期将深层神经网络与哈希编码融合的工作之一,该工作包括两个阶段来学习特征表示和哈希编码。CNNH 的一个缺点是通过学习得到的特征表示不能及时反馈给哈希编码。 为了克服 CNNH 的这一缺陷,「Network In Network HashingNINH」 提出了基于三元组损失函数来表示的相似性。研究表明,特征表示和哈希编码可以在一个框架内相互促进。 「3」大量的实验结果表明,我们的方法在问题上,取得了比现最好方法更好的结果,从而验证了我们方法的有效性。 摘要:随着网络上和视频数据的快速发展,近几年及视频也被广泛的研究。得益于深度学习的发展,深度哈希方法在方面也取得了一定的成果。

    1.4K60

    相关产品

    • 图像分析

      图像分析

      腾讯云图像分析基于深度学习等人工智能技术,提供综合性图像理解、图像处理、图像质量评估等服务,包含图像标签、logo识别、动漫人物识别、植物识别等,可以用于智能相册、视频理解、AI营销等场景…..

    相关资讯

    热门标签

    活动推荐

      运营活动

      活动名称
      广告关闭

      扫码关注云+社区

      领取腾讯云代金券