数字图像处理第2章.ppt_三一文库31doc.com

资源描述

《数字图像处理第2章.ppt》由会员分享，可在线阅读，更多相关《数字图像处理第2章.ppt（45页珍藏版）》请在三一文库上搜索。

1、第2章数字图像表示及其处理,本章重点：图像的数字化以及数字化图像表示方法图像存储格式用VC+实现图像的读、写以及显示的编程,2.1 人眼成像过程 2.2 简单的图像形成模型 2.3 图像的数字化 2.4 数字图像的基本类型 2.5 数字图像的基本文件格式,第2章数字图像表示及其处理,2.1 人眼成像过程,人眼是一个平均半径为20mm的球状器官。它由三层薄膜包围。最外层是坚硬的蛋白质膜，其中，位于前方的大约16部分为有弹性的透明组织，称为角膜，光线从这里进入眼内。,其余56为白色不透明组织，称为巩膜，作用是巩固和保护整个眼球。中间一层由虹膜和脉络膜组成。虹膜的中间有一个圆孔，称为瞳孔

2、。它的大小可以由连接虹膜的环状肌肉组织来调节，以控制进入眼睛内部的光通量大小，其作用和照相机中的光圈一样。最内一层为视网膜，它的表面分布有大量光敏细胞。,除了三层薄膜，在瞳孔后面还有一个扁球形的透明水晶体。水晶体的作用如同可变焦距的一个透镜，它的曲率可以由睫状肌的收缩进行调节，从而使景象始终能刚好地聚焦于黄斑区。眼睛的晶状体和普通光学透镜之间的主要差别在于前者的适应性强。,用眼睛看建筑物侧面的图解，C点是晶状体的光心,2.2 简单的图像形成模型,一幅图像实际上记录的是物体辐射能量的空间分布，这个分布是空间坐标、时间和波长的函数，即: I=(x,y,z,t)。当一幅图像为平面单色静止图像时，空

3、间坐标变量z ,波长和时间变量t可以从函数中去除，一幅图像可以用二维函数f(x,y)来表示: f(x,y)=i(x,y)r(x,y) 这里 0i(x,y) 0r(x,y)1 反射分量限制在0和1之间。i(x,y)的性质取决于照射源，而r(x，y)取决于成像物体的特性。,2.3 图像的数字化,数字图像可以理解为对二维函数f(x，y)进行采样和量化(即离散处理)后得到的图像，因此，通常用二维矩阵来表示一幅数字图像。将一幅图像进行数字化的过程就是在计算机内生成一个二维矩阵的过程。数字化过程包括三个步骤：扫描、采样和量化。,2.3.1 采样,采样（Sampling）:对图像空间坐标的离散化，它决定

4、了图像的空间分辨率。用一个网格把待处理的图像覆盖，然后把每一小格上模拟图像的各个亮度取平均值，作为该小方格中点的值；或者把方格的交叉点处模拟图像的亮度值作为该方格交叉点上的值。,图像的采样,对一幅图像采样时，若每行（即横向）像素为N个，每列（即纵向）像素为M个，则图像大小为MN个像素，从而f(x,y)构成一个MN实数矩阵：,每个元素为图像f(x,y)的离散采样值，称之为像元或像素。,2.3.1 量化,把采样后所得的各像素灰度值从模拟量到离散量的转换称为图像灰度的量化。量化是对图像幅度坐标的离散化，它决定了图像的幅度分辨率。,量化的方法包括：分层量化、均匀量化和非均匀量化。分层量化是把每一

5、个离散样本的连续灰度值只分成有限多的层次。均匀量化是把原图像灰度层次从最暗至最亮均匀分为有限个层次，如果采用不均匀分层就称为非均匀量化。,(a) 量化 (b) 量化为8 bit,量化示意图,(a) 256级灰度图象 (b) 子图 (c) 子图对应的量化数据,图像量化实例,(a),(b),(c),对一幅图像，当量化级数一定时，采样点数对图像质量有着显著的影响。采样点数越多，图像质量越好；当采样点数减少时，图上的块状效应就逐渐明显。当图像的采样点数一定时，采用不同量化级数的图像质量也不一样。量化级数越多，图像质量越好，当量化级数越少时，图像质量越差。量化级数最小的极端情况就是二值图像，图像会

6、出现假轮廓。,采样点数和量化级数的关系：,(a) 采样点256256时的图像 (b) 采样点6464时的图像 (c) 采样点3232时的图像 (d) 采样点1616时的图像,采样点数与图像质量之间的关系,(a),(b),(c),(d),(a) 量化为2级的Lena图像 (b) 量化为16级的Lena图像 (c) 量化为256级的Lena图像,量化级数与图像质量之间的关系,2.4 数字图像的基本类型,计算机一般采用两种方式存储静态图像：位映射（Bitmap），即位图存储模式；向量处理（Vector），也称矢量存储模式。位图也称为栅格图像，是通过许多像素点表示一幅图像，每个像素具有颜色属性和

7、位置属性。矢量图只存储图像内容的轮廓部分，而不是存储图像数据的每一点。,2.4.1 二值图像,二值图像也叫黑白图像，就是图像像素只存在0,1两个值。,二进制的lenna图像,2.4.2 灰度图像,灰度图像是包含灰度级的图像，如64级，256级等。如当像素灰度级用8 bit表示时，每个像素的取值就是256种灰度中的一种，即每个像素的灰度值为0到255中的一个。通常，用0表示黑，255表示白，从0到255亮度逐渐增加。,2.4.3 索引图像,索引图像把像素值直接作为索引颜色的序号。根据索引颜色的序号就可以找到该像素的实际颜色。当把索引图像读入计算机时，索引颜色将被存储到调色板中。调色板

8、是包含不同颜色的颜色表，每种颜色以红，绿，蓝三种颜色的组合来表示。调色板的单元个数是与图像的颜色数一致的。256色图像有256个索引颜色，相应的调色板就有256个单元。,2.4.4 RGB彩色图像,RGB图像是一类图像的总称。这类图像不使用单独的调色板，每一个像素的颜色由存储在相应位置的红、绿、蓝颜色分量共同决定。 RGB图像是24位图像，红、绿、蓝分量分别占用8位，理论上可以包含16M种不同的颜色。,2.5 数字图像的基本文件格式,每一种图像文件均有一个文件头，在文件头之后才是图像数据。文件头的内容一般包括文件类型、文件制作者、制作时间、版本号、文件大小等内容。各种图像文件的制作还涉

9、及到图像文件的压缩方式和存储效率等。常用的图像文件存储格式主要有BMP文件、JPG文件、PCX文件、TIFF文件以及GIF文件等。,2.5.1 BMP图像文件格式,第一部分为位图文件头BITMAPFILEHEADER，它是一个结构体，其定义如下： typedef struct tagBITMAPFILEHEADER WORD bfType; DWORD bfSize; WORD bfReserved1; WORD bfReserved2; DWORD bfOffBits; BITMAPFILEHEADER; 这个结构的长度是固定的，为14个字节（WORD为无符号16位二进制整数，DWORD为

10、无符号32位二进制整数）。,第二部分为位图信息头BITMAPINFOHEADER，也是一个结构，其定义如下： typedef struct tagBITMAPINFOHEADER DWORD biSize； LONG biWidth； LONG biHeight； WORD biPlanes； WORD biBitCount； DWORD biCompression； DWORD biSizeImage； LONG biXPelsPerMeter； LONG biYPelsPerMeter； DWORD biClrUsed； DWORD biClrImportant； BITMAPINFOHE

11、ADER；,这个结构的长度是固定的，为40个字节（LONG为32位二进制整数）。其中，biCompression的有效值为BI_RGB、 BI_RLE8、 BI_RLE4、BI_BITFIELDS。,第三部分为调色板(Palette) 。真彩色图像不需要调色板。调色板实际上是一个数组，共有biClrUsed个元素。数组中每个元素的类型是RGBQUAD结构，占4个字节，其定义如下： typedef struct tagRGBQUAD BYTE rgbBlue; /该颜色的蓝色分量 BYTE rgbGreen; /该颜色的绿色分量 BYTE rgbRed; /该颜色的红色分量 BYTE rgbR

12、eserved; /保留值 RGBQUAD;,第四部分就是实际的图像数据。对于用到调色板的位图，图像数据就是该像素颜色在调色板中的索引值，对于真彩色图像，图像数据就是实际的R、G、B值。对于2色位图，用1位就可以表示该像素的颜色（一般0表示黑，1表示白），所以一个字节可以表示8个像素。对于16色位图，用4位可以表示一个像素的颜色，所以1个字节可以表示2个像素。对于256色位图，一个字节刚好可以表示1个像素。,2.5.2 TIFF图像文件格式,标记图像文件格式TIFF (Tag Image File Format)是目前图像文件格式中最复杂的一种，也是目前流行的图像文件交换标准之一。 TI

13、FF格式文件的设计考虑了扩展性、方便性和可修改性，因此非常复杂，要求用更多的代码来控制它，结果导致文件读写速度慢， TIFF代码也很长。 TIFF文件由文件头、参数指针表与参数域、参数数据表和图像数据4部分组成。,参数指针由一个2字节的整数和其后的一系列12字节参数域构成，最后以一个长整型数结束。若最后的长整型数为0，表示文件的参数指针表到此为止，否则该长整数为指向下一个参数指针表的偏移。,2.5.3 GIF图像文件格式,GIF（Graphics Interchange Format）文件的全称是图形交换文件格式。该形式存储的文件主要是为不同的系统平台交流和传输图像提供方便,是在Web及其

14、他联机服务上常用的一种文件格式，用于 HTML文档中的索引颜色图像。图像最大不能超过64 M，颜色最多为256色。 GIF图像文件采取LZW压缩算法，存储效率高，支持多幅图像定序或覆盖，交错多屏幕绘图以及文本覆盖。 GIF主要是为数据流而设计的一种传输格式，而不是作为文件的存储格式。,GIF有五个主要部分以固定顺序出现，所有部分均由一个或多个块(block)组成。每个块第一个字节中存放标识码或特征码标识。这些部分的顺序为：文件标志块、逻辑屏幕描述块、可选的“全局”色彩表块(调色板)、各图像数据块（或专用的块）以及尾块（结束码）。,2.5.4 PCX图像文件格式,PCX文件格式由ZSoft公司

15、设计, 是最早使用的图像文件格式之一。 PCX支持256种颜色，结构较简单，存取速度快，压缩比适中，适合于一般软件的使用。 PCX 格式支持RGB、索引颜色、灰度和位图颜色模式，支持 RLE 压缩方法，图像颜色的位数可以是 1、 4、8 或 24。 PCX图像文件由三个部分组成：文件头、图像数据和256色调色板。,2.5.5 JPEG图像格式,JPEG(Joint Photographers Experts Group)即静止图像压缩标准, 是由ISO和CCITT为静态图像所建立的第一个国际数字图像压缩标准，主要是为了解决专业摄影师所遇到的图像信息过于庞大的问题。 JPEG 格式支持 24

16、位颜色，并保留照片和其他连续色调图像中存在的亮度和色相的显著和细微的变化。,2.5.6 用VC+实现BMP图像文件的显示,本节介绍如何在VC+ 6.0中编程实现BMP图像的显示。下面介绍具体步骤：,步骤一、打开VC+ 6.0，选择File|New进入界面,在Projects中选择MFC AppWinzard(exe)，在Project name中输入项目名称，本例为ReadBMP，在Location中输入项目要保存的文件夹。点击“OK”进入下一步。,步骤二、选择文档类型,在本例中使用的是单文档视图结构，所以这里选择Single document。其余部分设置使用VC+ 6.0的默认设置，点击

17、“Finish”完成项目创建。,步骤三、为了将BMP中的数据读入到内存中，在项目中建立专门处理BMP文件头和数据的文件：DIBAPI.H和DIBAPI.CPP，在其中实现对BMP文件的大部分处理。选择File|New从弹出界面Files选项中选择C/C+ Header File，建立一个新的头文件。在右边的File输入框中输入文件名，这里命名为DIBAPI，默认后缀为.H。,同上类似，选择C+ Source File建立DIBAPI.CPP文件。几个函数的详细代码解释见教材31-40页,步骤四、在CReadBMPDoc类中添加变量CPalette* m_palDIB 和HDIB m_hDIB

18、。m_hDIB用于保存当前BMP图像句柄，m_palDIB用于指向BMP图像对应的调色板。在CReadBMPDoc的构造函数中初始化：m_hDIB = NULL;m_palDIB = NULL。步骤五、为了取得保存在当前文档中的HDIB和Palette数据，在CReadBMPDoc类中添加方法：GetHDIB和GetDocPalette，具体见教材40-41页,步骤六、响应类CReadBMPDoc OnOpenDocument事件，以实现打开文件的操作。从“View|ClassWizard”进入“MFC ClassWizard”界面，在“Message Maps”选项中完成消息映射。具体

19、代码见教材42-44,步骤七、完成图片的打开操作之后，图片的数据就已经被保存在程序中，为了将图片显示出来还需要响应类CReadBMPView的OnDraw事件，在其中完成图像显示。具体代码见教材44页。步骤八、编译并运行程序，自此一个用于打开BMP图像的单文档视图结构的程序就完成了。通过修改当前位图句柄m_hDIB中存放像素的数据就可以对图像进行改变了。,2.6 小结,一幅图像实际上记录的是物体辐射能量的空间分布，这个分布是空间坐标、时间和波长的函数。当一幅图像为平面单色静止图像时，图像可以用二维函数f(x,y)来表示，它是一个有界函数。将一幅图像数字化的过程主要包括扫描，采样和量化，其结果就是在计算机内生成一个二维矩阵。计算机一般采用两种方式存储静态图像：一种是位映射，即位图存储模式；另一种是向量处理，也称矢量存储模式。,位图可以分成二值图像、索引图像、灰度图像和RGB图像四种。常用的图像文件存储格式主要有BMP图像文件、JPEG图像文件、PCX图像文件、TIFF图像文件以及GIF图像文件等。,

展开阅读全文