第2章数字图像基础.ppt

上传人:本田雅阁 文档编号:2973247 上传时间:2019-06-16 格式:PPT 页数:62 大小:10MB
返回 下载 相关 举报
第2章数字图像基础.ppt_第1页
第1页 / 共62页
第2章数字图像基础.ppt_第2页
第2页 / 共62页
第2章数字图像基础.ppt_第3页
第3页 / 共62页
第2章数字图像基础.ppt_第4页
第4页 / 共62页
第2章数字图像基础.ppt_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《第2章数字图像基础.ppt》由会员分享,可在线阅读,更多相关《第2章数字图像基础.ppt(62页珍藏版)》请在三一文库上搜索。

1、数字图像处理,第二章 数字图像处理基础 视觉感知要素 图像感知和获取 图像取样和量化 象素间的一些基本关系 线性和非线性操作,视觉系统,视觉基础 眼睛中的光接受器主要是视网膜中的视觉细胞。有两种类型的视觉细胞,分别称为锥状体和杆状体。锥状体只有在光线明亮的情况下才起作用,它具有辨别光波波长的作用,因此对颜色非常敏感。每个眼睛的锥状体大约有700万个。杆状体比锥状体的灵敏度高,在较暗的光线下就能起作用,但是它没有辨别颜色的能力,又叫夜视觉,所以黑暗中看到的东西没有颜色,其数量大约有1亿三千万个。 当眼睛接受到的光包含所有可见光信号,且其强度大体相近时,人们感觉到的是没有颜色的白光。在光源为白光的

2、照射下,若物体能反射80%以上的入射光,则看上去是白色的。若反射光小于3%,物体看上去是黑色的,中间值对应不同程度的灰色。为了表示方便,光强度可以规一化到01之间,0对应黑色,1对应白色,中间值对应灰色。,光能本身是无颜色的,颜色是人们眼睛感知光后产生的生理和心理现象。眼睛对光的感觉称为光觉,对颜色的感觉称为色觉,这是眼睛的基本特性。光觉的门限值大约为110cd/m(尼特),人眼感觉光的范围的最大值和最小值之比达到10以上。但人的眼睛并不能同时对这样大范围的明亮程度都作出反应。某一时刻眼睛只能感知很小范围的明亮度。 一般情况下,在相同亮度的刺激下,背景亮度不同所感觉到的明暗程度也不同,例如白天

3、我们看不见星星,而夜晚却能看到。同样,在观察颜色时,在图形的色度一样,但背景颜色不一样时,感觉到的图像的色度也不一样。这种现象叫做对比现象。对比现象包括亮度对比和颜色对比。实验表明,在背景亮度比目标亮度低的场合,感觉目标有一定亮度。当背景亮度比目标亮时,看到的目标就有亮的多的感觉。同时,对比效果在背景大的场合比较显著。,整体视觉过程 视觉 “视” “觉”,花瓶?还是人脸?,这两个图形在视网膜上是固定不动的,但你对它的感觉却是在两种可能 图形中动摇。 同时感觉到两种有意义的图形是很困难的!,女人腿还是男人腿?,2.1 视觉感知要素,眼睛的构造: (人眼包含有三层膜) 眼角膜与巩膜外壳 脉络膜 (

4、前面睫状体 虹膜 晶状体) 视网膜 (视网膜表面的分离光 接收器提供图案视觉, 分为锥状体、杆状体) 锥状体:位于视网膜中间,对颜色 灵敏度高,分辨图像细节. 白昼视觉 杆状体:分布在视网膜表面,无彩 色感觉,在低照明度下对 图像较敏感,用来给出 视野内一般的总体图像. 夜视觉,2.1 视觉感知要素,视网膜上锥状体和杆状体的分布,锥状体,杆状体,晶状体成像 晶状体成像与普通光学透镜原理类似,但晶状体可以根据需要调整曲率半径,分别对远处和近处的物体聚焦.,2.1 视觉感知要素,人眼对不同亮度的适应和鉴别能力 亮度适应范围: 1010量级 10-6ml 到 104ml 实验表明,主观亮度是进入 眼

5、睛亮度的对数函数 亮度适应现象: 人眼并不能同时在整个范围内 工作,而是利用改变整个灵敏 度来完成这一大变动的. 亮度适应级:视觉系统当前 的灵敏度级别,2.1 视觉感知要素,人眼适应的亮度范围 (1)总体范围大:从暗视觉门限到眩目极限之间的范围在1010量级 10-6ml 到 104ml (2)具体范围小:一般范围在102量级,辨别光强度变化的能力 典型实验 韦伯比 可辨别增量的50% 图2.5 用于描述亮度辨别特性的基本实验 图2.6 作为强度函数的典型韦伯比 当背景光保持恒定时,改变其他光源亮度,从不能察觉到可以察觉间变化,一般观察者可以辨别12到24级不同强度的变化.,2.1 视觉感知

6、要素,人眼感觉亮度并不是简单的强度函数 例1: 马赫带,2.1 视觉感知要素,例2: 背景变亮,相同强度的方块变暗,2.1 视觉感知要素,视觉错觉,2.1 视觉感知要素,电磁波谱可以用波长( )、频率或能量来描述 c 光速 h 普朗克常量,2.2 光和电磁波谱,2.2 光和电磁波谱,电磁波是能量的一种,任何有能量的物体,都会释放电磁波。,太阳或灯泡等光源发射可见光谱中的全部频率而产生白色光。当白色光投射到一个物体上时,某些频率被反射,某些则被物体吸收了。在反射光中混合的频率确定了人所感受到的物体的颜色。如果在反射光中以低频率为主,则物体呈现红色,此时,可以说光主要含有光谱中红色端的频率。 除了

7、频率以外,描述光的各种性质还需要另一些特征。在观察光源时,我们的眼睛对颜色(或主频率)和另外两个基本的感觉作出反应。其中之一是亮度,即感受到的光明度。第二个感受的特征是光的纯度或饱和度。这三种特征:主频率、明度和纯度通常用来描述光源的不同性质。通常用色度说明纯度和主频率这两种颜色特征。 另外,人的眼睛只能看到可见光部分,但就目前科技水平看,能够成像的并不仅仅是可见光。一般来说可见光的波长为0.380.76m,而迄今为止人类发现可成像的射线已有多种,如: 射线:0.0030.03nm; X射线:0.033nm; 紫外线:3300nm; 红外线:0.8300m; 微波:0.3100cm。 这些射线

8、均可以成像。利用图像处理技术把这些不可见射线所成图像加以处理并转换成可见图像,实际上大大延伸了人类视觉器官的功能,扩大了人类认识客观世界的能力。,2.2 光和电磁波谱,人从物体感受的颜色由物体反射光决定 若所有反射的可见光波长均衡,则物体显示白色 有颜色的物体是因为吸收了其他波长的大部分能量,从而反射某段波长范围的光。 没有颜色的光叫单色光,灰度级通常用来描述单色光的强度,其范围从黑到灰,最后到白。 在原理上,如果可以开发出一种传感器,能够检测由一种电磁波谱发射的能量,就可以在那一段波长上对感兴趣的物体成像。,2.2 光和电磁波谱,灰度和色彩,彩色模型: RGB 加色法 CMY,CMYK 减色

9、法 HSB (色泽,饱和度,明亮度),2.3 图像感知和获取,我们感兴趣的各类图像都是由“照射”源和形成图像的“场景”元素对光能或吸收相结合而产生的。 把照射量变为数字图像的传感器装置,2.3 图像感知和获取,用单个传感器获取图像,2.3 图像感知和获取,用带状传感器获取图像,2.3 图像感知和获取,用传感器阵列获取图像,2.3 图像感知和获取,简单的图像形成模型 f(x,y) 在特定坐标(x,y)处,通过传感器转换获得的f值为一正的标量。 函数f(x,y)由(1)入射到观察场景的光源总量 (2)场景中物体反射光的总量组成。 单色图像在任何坐标(x0,y0)处的强度为图像在该处的灰度级 lf(

10、x0,y0),显然有 可以规定灰度级范围为0,L-1,1,2.4 图像取样和量化,获取图像的目标是从感知的数据中产生数字图像,但多少传感器的输出是连续的电压波形,因此需要把连续的感知数据转换为数字形式。 这一过程由图像的取样与量化来完成。 数字化坐标值称为取样,数字化幅度值称为量化。,量化和采样是两个不同的概念,量化是在每个采样 点上进行的,所以必须先采样后量化。 量化和采样是图像数字化的不可或缺的两个操作, 二者紧密相关,同时完成。,2.4 图像取样和量化,M、N图像大小 L每个像素具有的离散灰度级数 一般取 M=2m,N=2n,L=2k NXN点的图像,每个灰度级L级, L=2k,占k位。

11、 存一幅图像所需的位数(bit)。 128x128x6=98304(bit)=12KB 512x512x8=2097152(bit)=256KB,2.4 图像取样和量化,2.4 图像取样和量化,2.4 图像取样和量化,2.4 图像取样和量化,2.4 图像取样和量化,2.4 图像取样和量化,黑白图像,灰度图像,彩色图像,2.4 图像取样和量化,黑白图像的数字化,2.4 图像取样和量化,灰度图像的数字化,2.4 图像取样和量化,彩色图像的数字化,2.4 图像取样和量化,图像的非均匀采样: 在灰度级变化尖锐(细节较多)的区域,用较多的采样;在灰度级比较平滑的区域,用粗糙的采样。 图像的非均匀量化:

12、非均匀量化是依据一幅图像具体的灰度值分布的概率密度函数,按总的量化误差最小的原则来进行量化. 具体做法是对图像中像素灰度值频繁出现的灰度值范围,量化间隔取小一些,而对那些像素灰度值极少出现的范围,则量化间隔取大一些. 由于图像灰度值的概率分布函数因图像不同而异,所以不可能找到可用于所有图像的最佳非等间隔量化方法.,均匀采样,非均匀采样,均匀量化 非均匀量化 矢量量化,经过数字化过程(采样、量化)得到矩阵:,2.4 图像取样和量化,数字图像的表示,2.4 图像取样和量化,数字图像的表示 本书中表示数字图像所用坐标的约定 M,N必须为正数,灰度 级取值为2的整数次幂 L=2k,为k位图像 图像存储

13、量 b=M*N*k,2.4 图像取样和量化,N和k变化时存储的比特数,2.4 图像取样和量化,空间分辨率:由取样值决定,图像中可辨别的最小细节 灰度级分辨率:灰度级中可分辨的最小变化 当没有必要对涉及像素的物理分辨率进行实际度量和在原始场景中分析细节等级时,通常把大小为MN,灰度为L级的数字图像称为空间分辨率为MN像素,灰度级为L级的数字像素。,2.3 图像取样和量化,灰度级为256,空间像素从10241024到3232的一组图像,2.4 图像取样和量化,所有图像放大到10241024,2.4 图像取样和量化,灰度级分别为256,128,64,32的数字图像,256,128,64,32,16,

14、8,2,4,灰度级从256到2的数字图像,2.4 图像取样和量化,同时改变N和k值,需要较多的灰度级, 随着L和N的增大,图像质量越好,2.4 图像取样和量化,同时改变N和k值,随着L和N的增大,图像质量越好,2.4 图像取样和量化,同时改变N和k值,只需较少的灰度级, 随着N的增大,图像质量越好,2.4 图像取样和量化,同时改变N和k值,face,cameraman,crowd,等偏爱线,2.4 图像取样和量化,水纹效应的实例,香农定理:如果一个函数以等于或大于其最高频率的2倍取样,那么就能从取样完全复原原函数.,如果函数被亚取样,则混淆的现象将恶化取样.,2.4 图像取样和量化,图像的放大

15、与收缩 最近邻域内插方法 在原图像上寻找最靠近的像 素并把它的灰度值赋给栅格上 的新像素。 双线性内插方法,2.4 图像取样和量化,用最近领域内插法(上一行)和双线性内插法(下一行)得到的放大图像 分别将128128,6464, 3232放大到10241024,2.5 像素间的一些基本关系,像素p,坐标(x,y)的邻居,2.5 像素间的一些基本关系,相邻像素 对于像素p,坐标(x,y) 4邻域 (x+1,y),(x-1,y),(x,y+1),(x,y-1) N4(p) 对角邻域 (x+1,y+1),(x+1,y-1),(x-1,y+1),(x-1,y-1) ND(p) 8邻域 N4(p) +

16、ND(p) N8(p),4邻域,对角邻域,8邻域,2.5 像素间的一些基本关系,像素的连通性 - 像素的连通性能够帮助简化区域、边界等概念; - 确定两个像素是否连通,看它们是否相邻以及灰度值是否满足特定的相似性准则。 定义V是用于定义邻接性的灰度值集合,存在三种类型的邻接性: (1)4邻接:如果q在N4(p)集中,具有V中数值的两个像素p和q是4邻接的. (2)8邻接:如果q在N8(p)集中,具有V中数值的两个像素p和q是8邻接的. (3)m邻接(混合邻接):如果(i)q在N4(p)中,或者(ii)q在ND(p)中且集合 N4(p)N4(q)没有V值的像素,则具有V值的像素p和q是m邻接的.

17、,2.5 像素间的一些基本关系,m邻接可以消除8邻接所带来的二义性,(a) 像素安排 (b)中心像素的8邻接像素 (c) m邻接,p,q1,p,q1,q2,q2,2.5 像素间的一些基本关系,对于两个图像子集S1和S2,如果S1中的某些像素与S2中的某些像素相邻,则称S1和S2是邻接的.,可以定义4邻接,8邻接和m邻接,2.5 像素间的一些基本关系,像素p (x,y)到像素q (s,t)的通路(path): 特定的像素序列(x0,y0),(x1,y1),(xn,yn),其中(x0,y0)=(x,y), (xn,yn)=(s,t),且像素(xi,yi)和(xi-1,yi-1)(对于1in)是邻接

18、的. n是通路的长度.若(x0,y0)=(xn,yn),则通路是闭合通路.,m通路,8通路,2.5 像素间的一些基本关系,像素p (x,y)到像素q (s,t)的连通: 令S表示一幅图像中的像素子集,如果在S中全部像素之间存在一个通路, 则可以说两个像素p和q在S中是连通的. 对于S中的任何像素p,S中连通到该像素的像素集叫做S的连通分量.如果S 仅有一个连通分量,则集合S叫做连通集. 令R是图像中的像素子集.如果R是连通集,则称R为一个区域. 一个区域R的边界(也称为边缘或轮廓)是区域中像素的集合,该区域 有一个或多个不在R中的邻点. 如果R是整幅图像,则边界由图像第一行、第一列和最后一行一

19、列定义. 正常情况下,区域指一幅图像的子集,并包括区域的边缘.,2.5 像素间的一些基本关系,距离度量: 对于像素p,q和z,其坐标分别为(x,y),(s,t)和(v,w),如果: D(p,q)0 D(p,q)=0,当且仅当p=q D(p,q)=D(q,p) D(p,z)D(p,q)+D(q,z) 则D是距离函数或度量. 欧式距离:De(p,q)=(x-s)2+(y-t)21/2 (距离小于等于r的像素形成中心在(x,y)的圆) D4距离:D4(p,q)=|x-s|+|y-t| (距离小于等于r的像素形成中心在(x,y)的菱形) D8距离:D8(p,q)=max(|x-s|,|y-t|) (距

20、离小于等于r的像素形成中心在(x,y)的方形),2.5 像素间的一些基本关系,基于像素的图像操作 2.6 线性和非线性操作 令H是一种算子,其输入和输出都是图像,如果对于任何两幅图像f和g及其任何两个标量a和b有如下关系,则称H为线性算子: H(af+bg)=aH(f)+bH(g) 对两幅图像的和应用线性算子等同于分别对图像应用该算子并各自于适当的常数相乘,然后将结果相加.,本章作业: 1 画出视觉信息在眼球内(视网膜中)的传输过程模型示 意图,并扼要说明之。 2 课后 2.2, 2.11, 2.15题 3.图像信息获取的设备有哪些? 4.简单的图像形成模型是什么? 5. 图像的取样和量化是指什么?一般怎么取?,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1