专栏首页python3Python3 图像识别(二)

Python3 图像识别(二)

Infi-chu:

http://www.cnblogs.com/Infi-chu/

以图搜图的使用已经非常广泛了,我现在来介绍一下简单的以图搜图的相关算法及其实践。

一、感知hash算法

感知哈希算法:
感知哈希算法(Perceptual hash algorithm)是哈希算法的一类,主要用来做相似图片的搜索工作。
图片所包含的特征被用来生成一组指纹(不过它不是唯一的), 而这些指纹是可以进行比较的。
步骤:
1.把图片转化为字符串,这个字符串就是图片的hash值,又称指纹。
2.求两个字符串之间的相似度(汉明距离),字符串越相似,即图片越相似。

 二、汉明距离

汉明距离:
汉明距离是两个字符串对应位置的不同字符的个数。换句话说,它就是将一个字符串变换成另外一个字符串所需要替换的字符个数。
例如:
1011101 与 1001001 之间的汉明距离是 2。
2143896 与 2233796 之间的汉明距离是 3。
“toned” 与 “roses” 之间的汉明距离是 3。

三、均值hash

下面的例子是使用了像素平均值,又叫均值哈希。
优点:均值哈希较为简单。
缺点:对图像灰度的平均值特别敏感,也不具备旋转不变性。
import cv2
def p_hash(path):
    # Step1. 把图像缩小为8 * 8,并转化为灰度图
    src = cv2.imread(path, 0)
    src = cv2.resize(src, (8, 8), cv2.INTER_LINEAR)
    # Step2. 计算64个像素的灰度均值
    avg = sum([sum(src[i]) for i in range(8)]) / 64
    #  Step3. 与平均值比较,生成01字符串
    string = ''
    for i in range(8):
        string += ''.join(map(lambda i: '0' if i < avg else '1', src[i]))
    # Step4. 计算hash值
    result = ''
    for i in range(0, 64, 4):
        result += ''.join('%x' % int(string[i: i + 4], 2))
        return result

def hamming(str1, str2):
    if len(str1) != len(str2):
        return
    count = 0
    for i in range(0, len(str1)):
        if str1[i] != str2[i]:
            count += 1
    return count

# 读取四张图片,进行测试
h1 = p_hash('1.jpg')
h2 = p_hash('2.jpg')
h3 = p_hash('3.jpg')
h4 = p_hash('4.jpg')

# 四张图片的相互对比
print('1&2 --> ',hamming(h1,h2))
print('1&3 --> ',hamming(h1,h3))
print('1&4 --> ',hamming(h1,h4))
print('2&3 --> ',hamming(h2,h3))
print('2&4 --> ',hamming(h2,h4))
print('3&4 --> ',hamming(h3,h4))

结果:

1&2 -->  1
1&3 -->  0
1&4 -->  1
2&3 -->  1
2&4 -->  1
3&4 -->  1

四、余弦感知哈希

为了提升更好的识别效果,可以使用余弦感知哈希算法。
优点:能够处理旋转图形。
缺点:只能够识别变形程度在25%以内的图片。

步骤:
1.缩小尺寸:将图像缩小到32*32,并转为灰度图。
2.计算DCT:对图像进行二维离散余弦变换。
3.缩小DCT:只保留矩阵左上角8*8区域,对这个区域求哈希均值,并生成01字符串。
4.计算hash值。
5.求汉明距离
import numpy as np
import cv2

def p_hash(path):
    # Step1. 把图像缩小为32 * 32,并转化为灰度图
    src = cv2.imread(path, 0)
    src = cv2.resize(src, (32, 32), cv2.INTER_LINEAR)

    # Step2. 对图像进行余弦变换
    h, w = src.shape[:2]
    arr = np.zeros((h, w), np.float32)
    arr[:h, :w] = src
    src = cv2.dct(cv2.dct(arr))  # 离散余弦变换
    src.resize(8, 8)

    # Step3. 计算64个像素的灰度均值
    avg = sum([sum(src[i]) for i in range(8)]) / 64

    # Step4. 与平均值比较,生成01字符串
    string = ''
    for i in range(8):
        string += ''.join(map(lambda i: '0' if i < avg else '1', src[i]))

    # Step5. 计算hash值
    result = ''
    for i in range(0, 64, 4):
        result += ''.join('%x' % int(string[i: i + 4], 2))
    return result


def hamming(str1, str2):
    if len(str1) != len(str2):
        return
    count = 0
    for i in range(0, len(str1)):
        if str1[i] != str2[i]:
            count += 1
    return count

# 读取四张图片,进行测试
h1 = p_hash('1.jpg')
h2 = p_hash('2.jpg')
h3 = p_hash('3.jpg')
h4 = p_hash('4.jpg')

# 四张图片的相互对比
print('1&2 --> ',hamming(h1,h2))
print('1&3 --> ',hamming(h1,h3))
print('1&4 --> ',hamming(h1,h4))
print('2&3 --> ',hamming(h2,h3))
print('2&4 --> ',hamming(h2,h4))
print('3&4 --> ',hamming(h3,h4))
print('1&1 --> ',hamming(h1,h1))

结果:

1&2 -->  3
1&3 -->  1
1&4 -->  6
2&3 -->  3
2&4 -->  6
3&4 -->  5
1&1 -->  0

图例:

‘1.jpg’

‘2.jpg’

‘3.jpg’

‘4.jpg’

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • python 1

    [root@room1pc01 桌面]# cat  ipmac.txt    192.168.4.5   121212452242    192.168.4.2...

    py3study
  • 2.Python入门到精通

    第二个改进要求:程序应该提供多次机会给用户猜测,专业点来讲就是程序需要重复运行某些代码。

    py3study
  • python3 猜数字小游戏2.0

    #!/usr/bin/python print ( "----------这是一个猜数游戏----------" ) temp = input( "请输入一个...

    py3study
  • 那些实用的 Chrome 扩展神器(三)

    那些实用的 Chrome 扩展神器(二),这里继续分享实用的 Chrome 扩展。

    苏生不惑
  • 微信改版首次复盘:公众号写作套路曝光

    前段日子,微信公众后台做出的重大改版,简直帮了我们大忙。更新后的公众号可以监测到每篇文章的完整阅读率。也就是说,你们是否喜欢我们的文章,都可以通过数据反馈给我们...

  • 微信,我小鸡忍你很久了…… | 开发

    知晓君
  • 位运算之异或(XOR)

    一个二进制数减1, 相当于把这个数的从最右侧的1开始flio翻转

    CoffeeLand
  • 视频监控流媒体传输量大时如何选择监控交换机?

    我们都知道,交换机是监控网络传输的核心设备。一般在使用流媒体服务器进行监控直播的时候,设备少、数据传输量较少的时候,则不需要使用交换机,但是当设备多,数据传输大...

    EasyNVR
  • 洛谷1072(gcd的运用)

    Hankson 的“逆问题”就是求出满足条件的正整数x。但稍加思索之后,他发现这样的x 并不唯一,甚至可能不存在。因此他转而开始考虑如何求解满足条件的 x 的个...

    ACM算法日常
  • 当面试官问“你有什么要问我的吗”时,应该说什么?

    相信大家面试时或许都经历过这么一个过程:不管是500强公司还是创业公司,是国企还是外企,面试到最后,面试官往往会问:“你还有什么问题吗?”

    一墨编程学习

扫码关注云+社区

领取腾讯云代金券