“要想成功,就必须弄清楚基础问题。”
01
—
视觉感知
图像是人类视觉的基础,是自然景物的客观反映,是人类认识世界和人类本身的重要源泉。“图”是物体反射或透射光能量的分布,“像”是人的视觉系统所接收的“图”在人脑中所形成的印象或认识。虽然数字图像处理领域建立在数学和概率公式表示的基础之上,但人的直觉和分析在选择一种技术而不选择另一种技术时会起核心作用。
视网膜图像主要聚焦在中央凹区域,光接收器的相对刺激作用产生感知,把辐射能转变为电脉冲,最后由大脑解码。当眼睛适当地聚焦时,来自眼睛外部物体的光在视网膜上成像。视网膜表面分布的不连续的光,感受器提供图案视觉,其中由两类感受器:锥状体和杆状体。锥状体可以分辨图像细节,每个锥状体连接到自身神经末梢,其被称为白昼视觉。杆状体用于给出视野内的一般总体图像。人的视觉系统能够适应的光强度级别范围很宽——从暗阈值到强闪光约有10次数量级。
02
—
图像感知和获取
数字图像的表示通过使用f(s,t)表示一幅具有两个连续变量s和t的连续图像函数。假如我们把该连续图像取样成一个二维阵列f(x,y),该阵列包含有M行和N列,其中(x,y)是离散坐标。通过传感器阵列获取数字图像的过程如下图所示
通过获取场景元素的光,成像系统首先收集入射能量,通过成像系统中的透镜把观察场景投影到透镜的聚焦平面上,与聚焦平面重合的传感器阵列产生与每个传感器接收光总量成正比的输出,数字电路扫描这些输出,将其转换成电信号,最终输出数字图像。
成像系统的传感器存在单个传感器来进行获取图像,后来发现单传感器在处理部分图像获取时效率太低拓展到条带传感器和传感器阵列。这些类型的传感器现如今应用到不同场景。
03
—
图像存储
数字图像生产后,要用存储空间保存。如对于长,宽各为512像素的真彩图,每个像素都用R,G,B三个分量表示。每个分量有256个亮度级,用8bit来表示,所以每个像素需要3个字节。整个图约512*512*3,约为768k字节。
图像以其存储方式的不同可将其分为多种文件格式,下面介绍常见图像文件格式:BMP和JEPG
位图文件(BMP)
Windows操作系统存储位图使用了调色板技术来节省存储空间。用一个索引表(调色板)来描述用到的颜色,表中每一行记录一种颜色RGB值。位图文件大体上分成四个部分:文件头,信息头,调色板,实际数据;其对应结构体定义为
//文件头
typedef struct tagBITMAPFILEHEADER
{
WORD bfType;//指定文件类型
DWORD bfSize;//指定文件大小
WORD bfReserved1;//保留字段
WORD bfReserved2;
DWORD bfOffBits;//文件头到实际位图数据偏移字节数
} BITMAPFILEHEADER;
//WORD为无符号2字节,DWORD为无符号4字节。
//信息头
typedef struct tagBITMAPINFOHEADER
{
DWORD bfSize;//指定结构大小
LONG biWidth;//图像宽
LONG biHeight;//
WORD biPlanes;//图像彩色平面数
WORD biBitCount;//颜色用到的位数
DWORD biCompression;//位图是否压缩
DWORD biSizeImage;//实际位图数据占用字节数
LONG biXPelsPerMeter;//目标设备水平分辨率
LONG biYPelsPerMeter;//目标设备垂直分辨率
DWORD biClrUsed;//用到颜色数
DWORD biClrImportant;//重要颜色数
} BITMAPINFOHEADER;
//调色板
typedef struct tagRGBQUAD
{
BYTE rgbBlue;
BYTE rgbGreen;
BYTE rgbRed;
BYTE rgbReserved;
} RGBQUAD;
//实际数据
每一行字节数必须是4的整数倍,如果不是,需要补齐;
*.bmp文件的数据从下到上,从左到右存储。
图像文件(JPEG)
JPEG是Joint picture expert group(联合图像专家组)缩写。是ISO和CCITT联合制定的静态图像压缩编码标准。
JPEG压缩原理是视觉原理,变换域特性,信息论原理和编码理论的综合。
JPEG编码流程
JPEG解码流程
参考:
1.《数字图像处理》(第三版)冈萨雷斯等编著;
2.《数字图像隐写分析》刘粉林等编著;
领取专属 10元无门槛券
私享最新 技术干货