第2章数字图像处理基础.ppt

资源描述

《第2章数字图像处理基础.ppt》由会员分享，可在线阅读，更多相关《第2章数字图像处理基础.ppt（40页珍藏版）》请在三一文库上搜索。

1、数字图像处理 (Digital Image Processing）,数字图像处理与模式识别研究所山东科技大学信电学院,第二章图像和视觉基础,2.1 光的特性 2.2 视觉系统 2.3 颜色 2.3.1 CIE色度图 2.3.2 常用颜色模型 2.4 图像的表示,2.1 光的特性,光是一种电磁波。在电磁波谱中，可见光仅占很窄的一个波谱范围。其波长在0.380.76m之间。下图(a)示出电磁波谱的大致划分。可见光的低频率端是红色，高频率段是紫色。从高频到低频的光谱颜色的变化分别是紫、蓝、青、绿、黄、橙、红，如图(b)所示。太阳或灯泡等光源发射可见光谱中的全部频率而产生白色光。当白色光投射到一

2、个物体上时，某些频率被反射，某些则被物体吸收了。在反射光中混合的频率确定了我们所感受到的物体的颜色。如果在反射光中以低频率为主，则物体呈现红色，此时，我们可以说光主要含有光谱中红色端的频率。,除了频率以外，描述光的各种性质还需要另一些特征。在观察光源时，我们的眼睛对颜色（或主频率）和另外两个基本的感觉作出反应。其中之一是亮度,即感受到的光明度。第二个感受的特征是光的纯度或饱和度。这三种特征：主频率、明度和纯度通常用来描述光源的不同性质。通常用色度说明纯度和主频率这两种颜色特征。另外，人的眼睛只能看到可见光部分，但就目前科技水平看，能够成像的并不仅仅是可见光。一般来说可见光的波长为0.380.

3、76m，而迄今为止人类发现可成像的射线已有多种，如：,射线：0.0030.03nm； X射线：0.033nm；紫外线：3300nm；红外线：0.8300m；微波：0.3100cm。这些射线均可以成像。利用图像处理技术把这些不可见射线所成图像加以处理并转换成可见图像，实际上大大延伸了人类视觉器官的功能，扩大了人类认识客观世界的能力。,2.2 视觉系统,眼睛中的光接受器主要是视网膜中的视觉细胞。有两种类型的视觉细胞，分别称为锥状体和杆状体。锥状体只有在光线明亮的情况下才起作用，它具有辨别光波波长的作用，因此对颜色非常敏感。每个眼睛的锥状体大约有700万个。杆状体比锥状体的灵敏度高，在较暗的

4、光线下就能起作用，但是它没有辨别颜色的能力，又叫夜视觉，所以黑暗中看到的东西没有颜色，其数量大约有1亿三千万个。当眼睛接受到的光包含所有可见光信号，且其强度大体相近时，人们感觉到的是没有颜色的白光。在光源为白光的照射下，若物体能反射80%以上的入射光，则看上去是白色的。若反射光小于3%，物体看上去是黑色的，中间值对应不同程度的灰色。为了表示方便，光强度可以规一化到01之间，0对应黑色，1对应白色，中间值对应灰色。,光能本身是无颜色的，颜色是人们眼睛感知光后产生的生理和心理现象。眼睛对光的感觉称为光觉，对颜色的感觉称为色觉，这是眼睛的基本特性。光觉的门限值大约为110cd/m(尼特），人眼感觉

5、光的范围的最大值和最小值之比达到10以上。但人的眼睛并不能同时对这样大范围的明亮程度都作出反应。某一时刻眼睛只能感知很小范围的明亮度。一般情况下，在相同亮度的刺激下，背景亮度不同所感觉到的明暗程度也不同，例如白天我们看不见星星，而夜晚却能看到。同样，在观察颜色时，在图形的色度一样，但背景颜色不一样时，感觉到的图像的色度也不一样。这种现象叫做对比现象。对比现象包括亮度对比和颜色对比。实验表明，在背景亮度比目标亮度低的场合，感觉目标有一定亮度。当背景亮度比目标亮时，看到的目标就有亮的多的感觉。同时，对比效果在背景大的场合比较显著。,2.3 颜色,白光通过棱镜，就会折射出颜色的光谱。一般可以分解成

6、红、橙、黄、绿、蓝、青、紫七色。可见光谱的每部分都有它自己唯一的值，它被称之为颜色，理论上可以选择几百万种颜色，从一种颜色转换成另一种颜色实际上很难区别。可见光谱可以由多种颜色构成，但是人们一般只看到一种颜色，它是多种颜色混合后结果。因为人眼有把多种颜色相混合的能力。在心理生物学上，颜色由其色彩、色饱和度和明度决定。顾名思义，色彩即颜色的“色彩”，它是某种颜色据以定义的名称。色饱和度是单色光中掺入白光的度量，单色光的色饱和度为100%，白光加入后，其色饱和度下降，非彩色光的色饱和度为0%，明度为光的强度值。,在心理物理学上，与色彩、色饱和度和明度相对应的是主波长、色纯和亮度。在可见光谱上，单

7、一波长的电磁能所产生的颜色是单色的。光的颜色由其主波长决定，而色纯则由单色光中掺入的白光量的相对大小决定。亮度与光的能量成比例，它是单位面积上所接受的光强。纯的单色光在实际生活中是少见的，人们所看到的颜色都是混合色。彩色图形显示器（CRT）上每个像素都是由红、绿、蓝三种荧光点组成，这是以人类视觉颜色感知的三刺激理论为基础设计的。三刺激理论基于这样一个假设：人类眼睛视网膜中的锥状视觉细胞，分别对红、绿、蓝三种光最敏感。实验表明，对蓝色敏感的细胞对波长为440nm左右的光最敏感；对绿色敏感的细胞对波长为545nm左右的光最敏感；对红色敏感的细胞对波长为580nm左右的光最敏感。实验还显示，人类眼

8、睛对蓝光的灵敏度远远低于对红光和绿光的灵敏度。,2.3.1 CIE色度图,两种不同的颜色可以混合生成另一种颜色。如果两种颜色混合成白色光，它们就被称为互补色。红色和青色，绿色和品红，以及蓝色和黄色都是互补色。适当选择两种或多种初始颜色，可以形成许多其它颜色。用来生成其它颜色的初始颜色称为基色。在实际的基本颜色中，没有哪一组集合能组合生成所有可见的颜色。然而，三种基色对多数应用来说是足够的。通常采用红、绿、蓝作为三种基色，即RGB加色系统。下图示出用来生成任何一种光谱颜色的红、绿、蓝色的量。从曲线图中可知，500nm波长附近的颜色只能从蓝光和绿光混合相加所得的光中再加负红光才能得到。但实际上不

9、存在负的光强，因此，RGB彩色监视器不能显示500nm波长左右的颜色。,颜色匹配所需的RGB基色量,在实际的基本颜色中，没有哪一组集合能组合生成所有可见的颜色。然而，三种基色对多数应用来说是足够的。通常采用红、绿、蓝作为三种基色，即RGB加色系统。上图示出用来生成任何一种光谱颜色的红、绿、蓝色的量。从曲线图中可知，500nm波长附近的颜色只能从蓝光和绿光混合相加所得的光中再加负红光才能得到。但实际上不存在负的光强，因此，RGB彩色监视器不能显示500nm波长左右的颜色。由于没有哪一组彩色光源可用来组合显示所有可能的颜色，国际照明委员会（CIE）在1931年定义了三种标准基色X,Y,Z。这三种

10、基色是想像的颜色。定义这三基色的同时还定义了一组彩色匹配函数，如下图所示。图中曲线不是代表基色的光谱，而是用来代表匹配各种可见色光所需的每一种基色的量。这就给出了定义各种颜色的国际标准，而且使用CIE基色避免了颜色的负值匹配。,颜色匹配所需的XYZ基色量,CIE规定三基色为XYZ,任何一种颜色C可以表示成: CXXYYZZ 其中，X,Y,Z是为匹配颜色C所需标准基色的量。如果只考虑颜色的色彩和纯度，那么可以将式(8-42)中的亮度规范化，即作如下计算： xX/(XYZ)，yY/(XYZ)，xZ/(XYZ) 这里，xyz=1。因此，任何一种颜色可仅用x和y表示出来。由于x和y仅依赖于色彩和纯度

11、，所以称为色度值。色度值表示生成一种颜色所需X,Y,Z三基色的相对量，但不表示颜色的亮度，亮度由Y表示，X和Z可根据它们对Y的比例来确定。下图为国际照明委员会给出的CIE色度图，其图形轮廓线代表所有可见光波长的轨迹，线上数字标明该位置可见光的波长。红色位于图的右下角，绿色在图顶端，蓝色在图左下角，连接光谱轨迹两端点的直线称为紫色线，它并不属于光谱。内部的点表示所有可能的可见颜色的组合，中间的C点对应于亮白色位置，它用作平均日光的近似标准。由于规范化，色度图中没有亮度值,具有同一色度但不同亮度的颜色位置相同。,CIE色度图,CIE色度图有多种用途。欲获得一种光谱色的补色，只需从这一点通过C点作一

12、条直线，求出其与对側光谱轨迹的交点，即可求得补色波长,如上图中C1的补色为C2，或者说C1和C2互为补色。两种补色按一定比例相加得白色。求一种颜色的主波长时，只要连接颜色所在位置与C点的直线，直线与位于颜色同侧的光谱轨迹线交点即为主波长，如下图中C3的主波长为C4。但如果交点在紫色线上，则主波长应是位于颜色反侧的光谱轨迹线交点，如图8.27中C5同C点相连同侧的交点为C6，在紫色线上，因此C5的主波长为反侧的C7。,用CIE色度图确定补色、主波长和纯度,单纯色或全饱和色位于光谱轨迹上，其色纯度为100%，而C点色纯度为O%。任一中间颜色的色纯度即等于C点与它之间距离除以C点至光谱轨迹线或紫色线

13、之间的距离。例如上图中C3颜色的色纯约等于25%，而C4颜色的色纯为100%，色纯度用百分数表示。,2.3.2 常用颜色模型,1. RGB颜色模型国际照明委员会选择红色（波长=700.00nm)、绿色（波长=546.1nm)、蓝色（波长=435.8nm)三种单色光作为表色系统的三基色，这就是CIE的RGB(Red,Green,Blue)颜色表示系统。我们通常使用的彩色光栅显示器采用的就是RGB颜色模型系统。 RGB颜色模型是相加混色，称为加色系统。如下图所示。白光可以由RGB三种基本色相加得到。产生1lm(流明)的白光所需要的三基色近似值可以用下面的亮度方程来表示： 1lm(白光)0.30l

14、m(红)0.59lm(绿)0.11lm(蓝) 即产生白光时，三基色的比例关系是不等的，这给实际使用带来一些不方便。,RGB加色系统,为了克服这一缺点，使用了三基色单位制，即所谓的T单位制。在使用T单位制时，其方程可以改写如下： 1lm(白光)1T(红)1T(绿)1T(蓝) 即1T单位红光=0.30lm，1T单位绿光=0.59lm，1T单位蓝光=0.11lm，这也是T单位与流明数的关系。由不同的RGB分量相加就可以产生其他的颜色，即： CrRgGbB 式中C为混合色，r,g,b为匹配时使用T单位制，所需要RGB三基色的量值，r,g,b的取值范围在01之间。然而，仍然有不少颜色无法用RGB表示出

15、。下图中三角部分标出了RGB颜色模型系统所能表示的颜色区域。,RGB颜色范围,2. CMY颜色模型以品红、青、黄(Cyan,Magenta,Yellow)作为三基色所构成的颜色模型也是一种常用的颜色表示系统。它是一种减色系统。CMY减色系统和RGB加色系统颜色互为补色。所谓某颜色的补色是从白色中减去这种颜色后所得的颜色。品红是绿色的补色，青色是红色的补色，黄色是蓝色的补色。即相加系统的补色就是相减系统的基色(R+G=黄，G+B=青，R+B=品红）。下图示出了CMY和RGB的关系。,CMY和RGB的关系,与彩色光栅显示器RGB三支电子枪轰击屏幕荧光粉组合光颜色不同，打印机和绘图仪之类的硬拷贝设

16、备是通过往纸上涂颜料来生成彩色图片。我们通过反射光来看见颜色，这是一种减色处理。正如白色光经过品红色物体表面的反射或透射后，光谱中绿色部分被吸收和减去，人们看到物体呈现品红色，是一个减色过程。摄影的滤光镜也是利用这一原理。打印、绘图、印刷、胶卷以及非发光显示器等反射体通常采用CMY减色系统。使用CMY减色系统的打印处理通过四个墨点的集合来产生颜色点。三种基色（品红、青和黄）各使用一点，黑色也使用一点。因为品红色、青色和黄色墨水的混合通常生成深灰色而不是黑色，所以黑色单独包括在其中，使颜色效果更好。通过三种基色的墨水相互混合，产生不同颜色的组合。加上黑墨水后的颜色系统也称为CMYB模型。,25

17、6级常规灰度显示彩虹显示红色（R）饱和度显示绿色（G）饱和度显示蓝色（B）饱和度显示黄色（Y）饱和度显示青色（M）饱和度显示絮色（C）饱和度显示,2.4 图像的表征 2.4.1 图像表示为了对图像施以有效的处理，就要了解图像的内在特性。同时，为了方便地处理图像，用适当的数字模型去表征图像的特性也是十分必要的。在图像处理中常用的数字表征法有两种，一种是确定性的，一种是统计性的。用确定性的图像表征法可方便地研究图像的点的性质，而用统计表征法可用统计平均参数反映图像的特性。,物体,当用数学方法描述一幅图像时，常着重考虑它的点的性质。例如，一幅图像可以被看成是空间各个座标点上强度的集合

18、。它的最普遍的数学表达式为 I=f(x,y,z,t) 其中，x、y、z是空间坐标，是波长， t是时间， I是图像点的光强度。对静态图像，t为常数。对单色图像，为常数。对平面图像, z为常数。例如，对于静态平面单色图像，其数学表达式可以简化为： I=f(x,y),上面式子所表示的图像是多种多样的，要想对图像信息进行明确地分类也并非容易。只能就图像处理中常见的图像信息加以简单地分类。在数字图像处理中所涉及到的是一些最普通类型的图像。它们的突出特点是都具有特殊的统计特性，并且有专门的应用。从这个基点出发可做如下比较明快的分类：TV型的自然风景，这是一种常见的图像；空间摄影照片和地球资源探

19、测图片，这类图像构图不明显；电子显微镜照片和标准显微镜照片，这是一类在冶金学、医学及石油探测等都很感兴趣的一类照片；文本，这是指一些打印、印刷或手写的记号图像；图样，它们通常就是简单地由线段和图形构成的单色二值图像；专用图像，这一类图像大多是用特殊技术得到的图像，例如，X射线照片、红外热象、超声波图像等等。,2.4.2 数字图像的表示一般的图像（即模拟图像）是不能直接用数字计算机来处理的。为使图像能在数字计算机内进行处理，首先必须将各类图像（如照片，图形，X光照片等等）转化为数字图像。所谓将图像转化为数字图像或图像数字化，就是把图像分割成如图所示的称为象素的小区域每个象素的亮度或灰度值用一

20、个整数来表示。把图像分割成象素的方法可以是多种多样的，如图所示。即每个象素所占小区域可以是正方形的，六角形的或三角形的。与之相对应的象素所构成的点阵则分别为正方形网格点阵、正三角形网格与正六角形点阵。上述各象素分割方案中，正方形网格点阵是实际常用的。对一个正方形点阵，若任一象素沿水平与垂直方向上与相邻象素间距为1，则该象素沿斜线方向上的间距为,1. 采样采样就是把在时间上和空间上连续的图像转换成为离散的采样点（即象素）集的一种操作。由于图像是一种二维分布的信息，为要对它完成抽样操作，就需要先将二维信号变为一维信号，再对一维信号完成采样。具体做法是，先沿垂直方向，按一定间隔以上到下顺序地

21、沿水平方向直线扫描的方式，取出各水平行上浓淡（灰度）值的一维扫描线。而后再对该一维扫描线信号按一定间隔采样得到离散信号。即先沿垂直方向抽样，再沿水平方向抽样两步完成采样操作。对于运动图像（即时间域的连续图像），还需先在时间轴上采样，即先在时间轴上采样，再沿画面垂直方向采样，最后再沿画面水平方向上抽样这样三步完成采样操作。,若采样结果每行（即横向）象素为M个，每列（即纵向）象素为N个，则整幅图像大小为MN个象素。在进行采样时，采样点间隔的选取是一个非常重要的问题。它决定了采样后的图像忠实地反映原图像的程度。或者说，采样间隔大小的选取要根据原图像中包含何种程度的细微浓淡变化来确定。一般来说，图像

22、中细节越多，则抽样间隔应越小。根据一维采样定理，若一维信号g(t)最大频率为，若用T1/2为间隔进行抽样后，则根据抽样结果g(i,T）i=-1，0，1能完全恢复g(t)。,2.量化经过抽样，模拟图像已在时间、空间上离散化为象素。但抽样结果所得的象素的值（即浓淡值或灰度值）仍是连续量。把抽样后所得的这些连续量表示的象素值离散化为整激值的操作叫量化。即若连续浓淡（灰度）值用z来表示，则对于满足zizzi+1的z值都量化为整数值zi,zi称为象素的灰度值。z与zi的差称为量化误差。一般每个象素的灰度值量化后用一个字节（8位二是制码或8比特）来表示，如把由白一灰一黑的连续变化的灰度值，量化为0255

23、共256个灰度级。量化后的灰度值，代表了相应的浓淡程度。灰度值与浓淡程度的关系有两种表示方法，一种是由0255对应于由黑一白，另一种是由0255对应于由白一黑。在图像处理时，应注意是采用那种表示方法。对只有黑白二值的二值图像，一般用0表示白，1表示黑。,一幅数字化后的图像其总数据量是：每行象素数（M）每列象素数（N）灰度量所占用位数(Bits)。下面举例给出若干常用的M、N值。几种常用的图像大小如下：汉字：取决于字的大小，每个字可以从1616到256256象素；显微镜图像：256256或512512象素；电视图像：500700480象素；卫星图像：（单波殷）32402340象素； SAR（合成孔径雷达）80008000象素； CRT显示器：一般640480或10241024象素，20482048象素等,经过数字化过程（采样、量化）得到矩阵,y,x,o,

展开阅读全文