“以图搜图”的技术原理

展现独立思想 博采百家众长

汇集涓涓细流 共向辽阔海洋

以图搜图是利用图像识别技术,根据原始图片的颜色分布、几何形状、纹理等视觉特征,来搜索网络上的相似图片。

以图搜图是一种模糊搜索,搜索依据是与原图的相似程度,所得到的结果常常宽泛、粗略甚至失败。在搜索结果不理想的情况下,可以根据以图搜图的技术原理,预先对原始图片进行加工处理,使图片特征更加显著,以“迎合”以图搜图的算法,改善搜索效果。因此,有必要深入了解以图搜图的基本概念和原理,提高搜索效率。

以图搜图的技术方法有很多种,下面的一种称为“内容特征法”:

当上传一张原始图片后,搜索引擎会做如下处理:

(1)将原图转成一张较小的灰度图片,假定为50×50像素

(2)将灰度图片转换成黑白图片。转换时,先要为“黑”和“白”设定一个恰当的分界值,称为“阈值”,灰度小于这个阈值的像素被确定为“黑”,灰度大于这个阈值的像素被确定为“白”。阈值可以利用穷举法进行屡次试验而确定,确定的原则是使黑白图片的轮廓与原图尽量一致。

(3)按照一定的算法,将黑白图片中的每个像素用二进制数0或1表示,0代表黑,1代表白,形成一个50×50的0-1矩阵,称为“特征矩阵”,比如:

(4)将搜索到图片的特征矩阵与原图的特征矩阵进行比对,比对方法类似于“汉明距离”算法,即对两个矩阵中相同位置的二进制数值进行异或运算,若两个值相同则运算结果为0,否则为1。最后统计运算结果中1的个数,若少于一定数量则认为两张图片相似,否则认为不相似。

由此可知,特征矩阵是根据原始图片的内容所决定的,因此,可以在搜索前对图片进行预处理,如调整色相、饱和度、明度、对比度、清晰度、以及裁剪、局部加工等,强化图片的内容结构,突出图片特征,提高搜索效率。

看待一项事物,不但要“知其然”,更要“知其所以然”。网络上每项技术的背后都有相应的概念和原理,如果能够清楚地了解这些概念和原理,会更有效地使用网络技术,使其发挥更好的作用。

下一次,我们将通过一个具体案例,来说明如何对图像进行预处理,以提高“以图搜图”的检索精度。

欢迎关注白珍名师工作室

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180716G1924F00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券