import cv2
import numpy as np
import matplotlib.pyplot as plt
def make_pyramid(gray):
#图像裁剪
H,W=gray.shape
H-=H%32
W-= W%32
out=np.zeros((H,W),dtype=np.uint8)
out=gray[:H,:W]
pyramid=[out]
for i in range(1,6):
a=2.**i
p=cv2.resize(out, (int(out.shape[1]/a),int(out.shape[0]/a)),interpolation=cv.INTER_LINEAR)
p=cv2.resize(p,(int(p.shape[1]*a),int(p.shape[0]*a)),interpolation=cv.INTER_LINEAR)
pyramid.append(p.astype(np.float32))
return pyramid
#图像显著区域
def saliency_area(pyramid):
H, W=pyramid[0].shape
out=np.zeros((H, W),dtype=np.float32)
out+=np.abs(pyramid[0]-pyramid[5])
out+=np.abs(pyramid[0]-pyramid[4])
out+=np.abs(pyramid[0]-pyramid[3])
out+=np.abs(pyramid[3]-pyramid[2])
out+=np.abs(pyramid[4]-pyramid[1])
out+=np.abs(pyramid[5]-pyramid[0])
#归一化图像
out=out/out.max()*255
return out
img=cv2.imread("C:/Users/xpp/Desktop/Lena.png")
cv.imshow("original",img)
gray=cv2.cvtColor(img,cv.COLOR_RGB2GRAY)
#高斯金字塔
pyramid=make_pyramid(gray)
result=saliency_area(pyramid)
result=out.astype(np.uint8)
cv.imshow("result",result)
cv.imwrite("C:/Users/xpp/Desktop/result.png",result)
cv.waitKey(0)
cv.destroyAllWindows()
算法:图像显著区域是使用双线性插值调整图像大小至原图的1/2、1/4、1/8…,再使用双线性插值将生成图像放大到原图大小得到的金字塔两两求差相加并正规化到[0,255]获得图像灰度剧烈变化的区域,也是我们眼球感兴趣区域。
本文分享自 图像处理与模式识别研究所 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!