密文图像检索论文阅读笔记

一阅读内容

1.图像检索:

图像密文下的距离相对明文下的距离并不一致,利用mini-hash的值是否相似可以判断图像的相似性,利用同态的性质可以解决明文密文距离改变的问题,但是同态加密带来的巨大计算量很多移动云终端无法适配,考虑有没有比较轻量级的密文图像检索技术。

2可搜索加密

(1)对称可搜索加密:首个提出该技术的人是将文件以单词为量级进行切割划分,然后使用对称加密算法加密逐个单词(那用到的密钥都一样吗),检索式先对输入的关键词用相同密钥加密,将加密结果与之前文件的单词加密结果进行匹配扫描,以匹配到对应的单词,并记录单词的个数。

(2)布隆过滤器:将文件关键词映射为码字存在文件的索引中,利用布隆过滤器计算出文件是否包含某个关键词

(3)模糊关键词检索:(我在GIS项目中有增加这个功能,但是是针对明文检索的,用于检索专业单位列表)基于密文的模糊关键词检索是2010年才提出的哦。

(4)非对称可搜索加密:公钥加密,私钥解密,但是容易受到关键词猜测攻击,所以有论文提出了二次检索,首次检索是由不可信服务器基于陷门进行搜索,第二次检索是由用户在本地针对返回结果再进行一次检索。

(5)存在的安全问题是,检索返回的结果就一定是正确的吗?是否有相关验证机制,因为云服务器是不可信的,检索返回值可能出现错误、遗漏等问题。可验证模糊关键词检索的目标设计可以考虑使用布隆过滤器。

3.比较加密OPE:

(1)其中涉及的保序加密是指加密后明文和密文的顺序保持一致(什么的顺序?)

(2)容易被推测出比较数值的所在位置范围,所以出现了保留前缀的比较加密,将数值转换成二进制比特数(将什么数值转换呢?而且密文中为什么只是数值?图像视频这种数据难道也是数值?),然后逐比特加密(1个比特加密出来应该就不止一个比特了吧?而且用的是对称还是非对称加密呢?),带来的问题是密文空间较大,而且密文还要存储在服务器上,想想就很头疼,所以想到了缩短密文的扩展长度的办法,将明文的数值和每个数值所对应的比特都映射成一颗树上的叶子节点和普通节点,三次hash加密,或者用另一个办法,采用滑动窗口将二进制比特串分组加密,分组比较。

(3)同时也有相关方案可以支持多个用户加密的文件同时进行比较操作,而且不同用户所使用的密钥还不用相同。

(4)数值比较的结果为小于(-1)、等于()、大于(1)

4.同态加密

(1)部分同态加密

(2)全同态加密

(3)经典的同态加密Algorithms:

1)RSA

2)基于ElGamal

3)Paillier算法:非对称同态加密,加法同态,E(m1)·E(m2)=E(m1+m2)

5.数据降维方法:

(1)主成分分析:信源编码课上讲过,去相关,能量集中

(2)局部铭感哈希LSH:解决近似邻近距离搜索问题,通过降维在低纬层面可以快速搜索到满足一定相似度的高维数据

基本思想:低维数据=Special Hash(高维数据),高维中相似的某些数据在低维中仍然可以保持一定相似性,一定是因为降维通常都会带来信息丢失。

6.质疑

作者的提出的新方案是基于比较加密的,而对照组找的是一个基于同态加密方案,我们已知同态加密的问题是计算量大,在移动终端不好实施,比较加密问题是安全性超低,那么再将新方案和对照方案做计算量上的比较是否不妥,因为两个方案的安全性并不持平,这样要如何给出哪一个方案更优的评估呢。当然两个方案都采用了图像特征提取的技术。

Old:用局部保留投影技术做降维,以49维德特征向量作为对图像内容的描述

7.新密文图像加密方案

(1)前提条件:

假设云服务器处于好奇,会尽最大可能获得存储的图像与要输入的查询图像之间的相关信息,云服务器能看到的应该只有以下四个信息:

1)加密后存储在服务器的图像

2)加密后存储在服务器的图像特征向量

3)加密后存储在服务器的图像索引:根据特征向量构造的索引,用来表示某图像的特征向量和该图像之间的联系,以便服务器能根据索引检索到最终的图像。

4)加密后的要查询图像的特征向量

(2)检索索引结构:树形

左孩子(某一图像的Enc_特征向量)的模值

(3)流程:

ImageOwner:

1)从图像中提取特征向量:SIFT算法提取,用LSH算法降维

2)对图像加密(可以选择性加密)

3)对特征向量加密:采用比较加密技术,用到三个hash函数,最后输出降维后特征向量的token,总之要能支持可搜索加密

4)对应加密的特征向量,构造加密的检索索引和加密的图像索引(??为什么会是两种)

5)上传加密图像、加密检索索引、加密图像索引至Cloud

ImageSeracher:

1)从查询图像中提取特征向量:SIFT和LSH

3)对特征向量加密

4)Cloud检索加密特征向量(基于比较加密,但不逐比特比较,而是将特征向量的每一维进行比较,采用了开窗技术,距离度量是欧式距离),找到匹配的加密特征向量后,根据索引找到加密图像,返回给Owner

5)Owner解密图像,返回给Searcher(为什么不由Cloud直接解密呢?)

(4)如何验证检索结果的正确性:

对加密特征向量的距离比较结果与对明文特征向量的距离比较结果近似相等(为什么不直接说相等?)

8.实验仿真

(1)SIFT算法:提取图像特征向量,数据集是经典图像数据集INRIA Holiday,350幅图像,OpenCV2.4.9和VS2010

(2)LSH算法:图像数据降维,开源的基于欧几里得空间的LSH代码,从350副图像中提取7128074个关键点进行降维处理

(3)加密和检索:C++,2010,图像和图像索引被加密了,采用平衡二叉树建立索引结构

(4)评估指标:

1)加密开销:主要就是加密图像、加密索引的时间,(那加密特征向量的时间不算?)

2)检索开销:一层检索建立索引树,二层检索比对关键点(实验中用的是最简单的检索方式,但没说是哪种),耗时主要集中在二层检索时

3)检索精度:测试了5组图像,精度基本达到100%(但是我觉得测试组中的图片相似度不高)交叉重叠法返回检索结果会更精确。

二、蝶蝶的想法

为什么一直找不到基于密文的视频检索呢,输入视频片段,检索到雷同或相同的视频片断,可用于广告、影视剧片段的抄袭检索,可能会涉及的技术包括:

1基于内容的视频特征向量提取算法

2.视频特征向量降维算法

3.视频内容选择性加密算法

4.视频特征向量支持可搜索加密的算法

5.索引结构的设计

  • 发表于:
  • 原文链接:https://kuaibao.qq.com/s/20180526G1LMUY00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券