前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >基于度量学习的深度哈希图像检索研究初步探索

基于度量学习的深度哈希图像检索研究初步探索

作者头像
月梦@剑心
发布2022-09-14 14:00:44
4780
发布2022-09-14 14:00:44
举报
文章被收录于专栏:月梦·剑心的技术专栏

面对毕设题目一堆陌生的术语,我查阅资料进行了初步探索,对毕设有了大致了解。春恋慕 李聪的博客 基于度量学习的深度哈希图像检索研究

图像检索

图像检索是根据特征寻找图像的一种技术。

度量学习(Metric Learning)

定义:

度量学习(Metric Learning)是一种空间映射的方法,其能够学习到一种特征(Embedding)空间,在此空间中,所有的数据都被转换成一个特征向量,并且相似样本的特征向量之间距离小,不相似样本的特征向量之间距离大,从而对数据进行区分。度量学习应用在很多领域中,比如图像检索,人脸识别,目标跟踪等等。 在深度学习中,很多度量学习的方法都是使用成对成对的样本进行loss计算的,这类方法被称为 pair-based deep metric learning。例如,在训练模型的过程,我们随意的选取两个样本,使用模型提取特征,并计算他们特征之间的距离。 如果这两个样本属于同一个类别,那我们希望他们之间的距离应该尽量的小,甚至为0;如果这两个样本属于不同的类别,那我们希望他们之间的距离应该尽量的大,甚至是无穷大。正是根据这一原则,衍生出了许多不同类型的pair-based loss,使用这些loss对样本对之间的距离进行计算,并根据生成的loss使用各种优化方法对模型进行更新。

度量学习也就是常说的相似度学习。

如果需要计算两张图片之间的相似度,如何度量图片之间的相似度使得不同类别的图片相似度小而相同类别的图片相似度大(maximize the inter-class variations and minimize the intra-class variations)就是度量学习的目标。我的理解:度量学习的目标就是寻找更合适的损失函数 度量学习作为一个理想的替代(对手动规定距离函数的替代),可以根据不同的任务来自主学习出针对某个特定任务的度量距离函数。我的理解:可以根据不同的任务来自主学习出合适的损失函数

度量学习的方法:

通过线性变换的度量学习:也称为马氏度量学习问题,一些很经典的非监督线性降维算法(如主成分分析)可以看作属于非监督的马氏度量学习。 度量学习的非线性模型:非线性的度量学习更加的一般化,非线性降维算法可以看作属于非线性度量学习。经典的算法有等距映射(Isometric Mapping,ISOMAP) 、局部线性嵌入(Locally Linear Embedding, LLE) ,以及拉普拉斯特征映射(Laplacian Eigenmap,LE ) 等。另一个学习非线性映射的有效手段是通过核方法来对线性映射进行扩展。

大规模图像检索的深度哈希方法:

传统的图像检索,是先人工对图片进行文字标注,再利用文字来检索图片。具有很大的缺陷。 以图查图是更先进的方法,是基于内容的图像检索(CBIR)

哈希方法:

使用哈希方法来提升检索速度。如何提速?使用二值哈希的方法,即:将每张图片通过函数映射成为一定长度的二进制编码,将图片的二进制码间的汉明距离作为图像之间的相似程度,以此来提升速率。

深度哈希:

深度哈希方法来提升检索精度。CNN卷积神经网络具有传统方法不具备的特征提取能力,深度哈希将CNN与哈希图像检索结合,同时具有检索精度高,速度快的特点。 具体方法:训练一个CNN网络将图像映射成较低维度的特征,再将特征转化为二进制码进行检索。网络的设计以及训练数据的构建是决定检索精度的关键,不少研究团队提出了各种不同的深度哈希网络并在实验数据集上获得了成功。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022-01-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 图像检索
  • 度量学习(Metric Learning)
    • 定义:
      • 度量学习也就是常说的相似度学习。
        • 度量学习的方法:
        • 大规模图像检索的深度哈希方法:
          • 哈希方法:
            • 深度哈希:
            相关产品与服务
            人脸识别
            腾讯云神图·人脸识别(Face Recognition)基于腾讯优图强大的面部分析技术,提供包括人脸检测与分析、比对、搜索、验证、五官定位、活体检测等多种功能,为开发者和企业提供高性能高可用的人脸识别服务。 可应用于在线娱乐、在线身份认证等多种应用场景,充分满足各行业客户的人脸属性识别及用户身份确认等需求。
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档