“以图搜图”的技术原理

文章来源：企鹅号 - 白珍名师工作室

展现独立思想博采百家众长

汇集涓涓细流共向辽阔海洋

以图搜图是利用图像识别技术，根据原始图片的颜色分布、几何形状、纹理等视觉特征，来搜索网络上的相似图片。

以图搜图是一种模糊搜索，搜索依据是与原图的相似程度，所得到的结果常常宽泛、粗略甚至失败。在搜索结果不理想的情况下，可以根据以图搜图的技术原理，预先对原始图片进行加工处理，使图片特征更加显著，以“迎合”以图搜图的算法，改善搜索效果。因此，有必要深入了解以图搜图的基本概念和原理，提高搜索效率。

以图搜图的技术方法有很多种，下面的一种称为“内容特征法”：

当上传一张原始图片后，搜索引擎会做如下处理：

（1）将原图转成一张较小的灰度图片，假定为50×50像素

（2）将灰度图片转换成黑白图片。转换时，先要为“黑”和“白”设定一个恰当的分界值，称为“阈值”，灰度小于这个阈值的像素被确定为“黑”，灰度大于这个阈值的像素被确定为“白”。阈值可以利用穷举法进行屡次试验而确定，确定的原则是使黑白图片的轮廓与原图尽量一致。

（3）按照一定的算法，将黑白图片中的每个像素用二进制数0或1表示，0代表黑，1代表白，形成一个50×50的0-1矩阵，称为“特征矩阵”，比如：

（4）将搜索到图片的特征矩阵与原图的特征矩阵进行比对，比对方法类似于“汉明距离”算法，即对两个矩阵中相同位置的二进制数值进行异或运算，若两个值相同则运算结果为0，否则为1。最后统计运算结果中1的个数，若少于一定数量则认为两张图片相似，否则认为不相似。

由此可知，特征矩阵是根据原始图片的内容所决定的，因此，可以在搜索前对图片进行预处理，如调整色相、饱和度、明度、对比度、清晰度、以及裁剪、局部加工等，强化图片的内容结构，突出图片特征，提高搜索效率。

看待一项事物，不但要“知其然”，更要“知其所以然”。网络上每项技术的背后都有相应的概念和原理，如果能够清楚地了解这些概念和原理，会更有效地使用网络技术，使其发挥更好的作用。

下一次，我们将通过一个具体案例，来说明如何对图像进行预处理，以提高“以图搜图”的检索精度。

欢迎关注白珍名师工作室

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货