数字图像处理-002.ppt

上传人:本田雅阁 文档编号:3052780 上传时间:2019-07-01 格式:PPT 页数:159 大小:18.73MB
返回 下载 相关 举报
数字图像处理-002.ppt_第1页
第1页 / 共159页
数字图像处理-002.ppt_第2页
第2页 / 共159页
数字图像处理-002.ppt_第3页
第3页 / 共159页
数字图像处理-002.ppt_第4页
第4页 / 共159页
数字图像处理-002.ppt_第5页
第5页 / 共159页
点击查看更多>>
资源描述

《数字图像处理-002.ppt》由会员分享,可在线阅读,更多相关《数字图像处理-002.ppt(159页珍藏版)》请在三一文库上搜索。

1、放大、缩小,使图像在x轴方向放大(缩小)c倍,在y轴方向上放大(缩小)d倍,由于放大(缩小)算子运算不是一一映射,只是简单的重复放大,因此将产生所谓的“方块”效应,为改善这种可视效果,需要进行插值运算,放大、缩小,最简单的是减小一半,这样只需取原图的偶(奇)数行和偶(奇)数列构成新的图像。如果需要将原图像放大k倍,则将一个像素值添在新图像的k*k的子块中。,放大5倍,旋转,变换公式对图像绕原点顺时针角旋转变换,0,0,x,y,水平镜像,垂直镜像,灰度插值,图像的比例缩放、旋转变换时等,变换过程需要两个独立的算法: 一个算法完成几何变换;一个算法用于灰度级插值。 数字图像处理只能对坐标网格点(离

2、散点)的值进行变换。而坐标变换后产生的新坐标值同网格点值往往不重合,因此需要通过内插的方法将非网格点的灰度值变换成网格点的灰度值,这种算法称为灰度内插。,最邻近插值法:将与点P(x0,y0)最近的整数坐标点(x,y)的灰度值取为P(x0,y0) 点灰度近似值。 双线性插值(一阶插值) 高阶插值,双线性插值,根据点P(x0,y0)的四个相邻点的灰度值,通过两次插值计算出灰度值f(x0,y0),三阶插值法,三次内插法是指用(x ,y)周围的16个网格点灰度按三次多项式进行内插的高精度算法,图像邻域运算,邻域运算是指当输出图象中每个象素是由对应的输入象素及其一个邻域内的象素共同决定时的图象运算,通常

3、邻域是远比图象尺寸小的一规则形状,如正方形2x2、3x3、4x4或用来近似表示圆及椭圆等形状的多边形。相关与卷积,在图象处理中都表现为邻域运算。图像处理中,典型的邻域处理有局部的平滑、边缘检测等。使用到的模板Soble算子、LOG算子等。邻域运算与点运算一起形成了最基本、最重要的图象处理工具。 空域滤波是在图像空间借助模板进行邻域操作完成线性、非线性 运算。取局部邻域(2M+1)(2M+1)邻域的加权和局域处理。 功能: 1) 平滑:低通滤波器。提取较大目标前去除太小的细节或将目标内的 小间断连接起来消除噪声。 2)锐化:高通滤波器,增强被模糊的细节。,图像邻域运算,模板,邻域平均法,消除麻点

4、噪声的模板:,0,1,0,1,0,1,0,1,0,1/4,1/8,实现图像平滑最常见的方法是在像素邻域内求局部均值,称为均值滤波。,邻域平均法,(a)原图 (b)梯度运算,梯度运算,第四章 图像变换,图像变换,所谓变换,就是把某函数类A中的任意一个函数 ,经过某种可逆的积分方法(即为通过含参变量 的积分) 变为另一函数类 B中的函数 这里 是一个确定的二元函数,通常称为该积分变换的核。当选取不同的积分区域和核函数时,就得到不同名称的积分变换。 图像变换将原定义在图像空间的图像以某种形式转换到另外一些空间,并利用输入图像在这些空间的特有性质有效而快速地对图像进行处理和分析。最典型的变换有离散傅立

5、叶变换,它把空域中的图像信号看作二维时间序列,将其变换到频率域来分析图像的频谱特性。除了傅立叶变换外,常用的非空域的变换还有Gabor变换、小波变换、离散余弦变换、PCA变换等等。,变换核,离散傅里叶变换,变换核,傅立叶变换可分离性,基于二维离散傅里叶变换的分离性,二维离散FFT算法可以用两个一维FFT算法来实现,傅立叶变换,周期性,共轭对称性,中间部分为低 频部分,越靠 外边频率越高。,离散傅立叶变换的旋转不变性,图7-6 离散傅立叶变换的旋转不变性 (a) 原始图像; (b) 原始图像的傅立叶频谱; (c) 旋转45后的图像; (d) 图像旋转后的傅立叶频谱,Fourier 变换示意图,傅

6、立叶变换,Fourier变换有两个好处: 1)可以得出信号在各个频率点上的强度。 2)可以将卷积运算化为乘积运算。 应用: 1)我们可以在Fourier变换图中,选择所需要的高频或是低频滤波。 2)考虑到高频反映细节、低频反映景物概貌的特性。往往认为可将高频系数置为0,骗过人眼。进行压缩编码。 存在问题:它的参数都是复数,在数据的描述上相当于实数的两倍。 解决方法: DCT变换,利用了Fourier变换的实数部分构成变换。能够 达到相同功能但数据量又不大的变换。,离散余弦变换,一维变换核,二维变换核,离散沃尔什-哈达玛变换(WHT),沃尔什函数系是一个完备正交函数系,其值 只能取1和1。哈达玛

7、排序的沃尔什函数 是由2n(n=0,1,2,)阶哈达玛矩阵得到 的,哈达玛矩阵具有简单的递推关系, 高阶 矩阵可用两个低阶矩阵的克罗内克积求得。,离散沃尔什-哈达玛变换(WHT),求,的沃尔什-哈 达玛变换。,二维WHT具有能量集中的特性,而且原始数据中数字越是均匀分布,经变换后的数据越集中于矩阵的边角上。因此,二维WHT可用于压缩图像信息。,小波变换,像傅立叶分析一样,小波分析就是把一个信号分解为将母小波经过缩放和平移之后的一系列小波,因此小波是小波变换的基函数。小波变换可以理解为用经过缩放和平移的一系列小波函数代替傅立叶变换的正弦波和余弦波进行傅立叶变换的结果。,小波变换,离散小波变换的有

8、效 方法是使用滤波器。,从小波和正弦波的形状可以看出,变化剧烈的信号,用不规则的小波进行分析比用平滑的正弦波更好,即用小波更能描述信号的局部特征。,小波变换,第五章 图像增强,线性点运算,输出灰度级与输入灰度级呈线性关系的点运算。,非线性点运算,非线性变换往往以牺牲某些灰度范围的图像信息(灰度压缩),来换取其它灰度范围的图像信息的改善(灰度拉伸)。,直方图用途,观察直方图可以看出不合适的数字化。,直方图均衡: 把原始图的直方图变换为均匀分布的形式,增加像素灰度值的动态范围,提高图像对比度。 原始图像的累计直方图满足下面两条件且能将f的分布转换为均匀分布 a)在 内单值递增,保证由黑到白 b)保

9、证动态范围一致,直方图均衡化,直方图均衡化,直方图均衡化,直方图均衡化,直方图规定化,直方图规定化,直方图规定化,邻域平均法,mask,滤波核h(x,y):,h(x,y)矩阵的元素之和乘前面系数为1,h(x,y)矩阵中心的元素占的比例 越小,越平滑,图像越模糊。 模板越大,模糊作用越强。 局部求均值的运算或平均计算使数字信号变“平坦”,可以在图像中消除 或抑制噪声。同时,图像中景物边缘也会不同程度地变得模糊。,非加权邻域平均法的增强效果 (a)为含有随机噪声的灰度图像 (b)(c)(d)是分别用33、 55、77模板得到的平滑图像。,结论: 对相同类型的平滑滤波器,滤波器尺寸越大,噪声滤除效果

10、愈好,但细节模糊效应也越强。,邻域平均法改进,中值滤波,中值滤波与均值滤波的区别仅限于:中值滤波是求局部中值而不 是局部均值,即对参与计算的像素灰度值按大小排序,然后取位置居 中的像素灰度值。中值直接取自某个像素的灰度值,所以能较好地保 持图像景物原状。窗口形状有方形、十字形、圆形、圆环形等。,用33方形,图像全为0 用33十字,保留了线状细节,丢失了点状细节,使用二维滤波需注意 1)有尖顶角几何结构的图像,一般采用十字窗,大小不超过最小有效物体的尺寸 2)有较多的点、线、尖顶角的细节结构,不用中值滤波,中值滤波,中值滤波与均值滤波,中值滤波和平均值滤波比较 (a) 阶跃;(b)斜坡;(c)单

11、脉冲;(d)双脉冲;(e)三脉冲; (f)三角波,图4-24 噪声平滑实验图像 (a) Lena原图; (b) 高斯噪声; (c) 椒盐噪声; (d) 对(b)平均平滑; (e) 对(c)平均平滑; (f) 对(b)55中值滤波; (g) 对(c)55中值滤波,频域低通滤波法,TLPF,ELPF,BLPF,ILPF,低通滤波,图像锐化,补偿图像的轮廓,突出图像中景物的边缘或纹理,使图像清晰。图 像模糊的原因图像被平均或积分, 为实现图象的锐化,需反运算 “微分” 增强高频分量,使图像边缘清晰,但同时也增强了噪声。 1平均或积分效应引起用微分处理; 2模糊可看作图像上高频分量被削弱高频增强,索贝

12、尔算子(sobel),拉普拉斯算子(laplace),图像锐化算子,图像锐化,Sobel算子,Roberts算子,Prewitt算子,原图,直接求梯度图,高通滤波,滤波效果,同态增晰,作用 消除图像上照明不均的问题,增加暗区的图像细节,同时又不损失亮区的图像细节,它在频域中同时将图像亮度范围进行压缩和将图像对比度进行增强 成像物理背景 人眼对图象亮度响应具有类似于对数运算的非线性形式 f(x, y) = I(x,y) R(x,y) I(x,y):照射分量(低频) R(x, y):反射分量(高频)(图象细节的不同在空间作快速变化),关心反射信息,但室内外照射分量强度不同,图片明暗不均,能否消除照

13、度不均,而增强反射部分比重?,f (x,y)=i(x,y)r(x,y) (1)z(x,y) = ln f(x,y) = lnI(x,y) + lnR(x,y) 把频谱分开 (2)Z(u,v) = I(u,v) + R(u,v) 傅立叶变换 (3)S(u,v) = H(u,v) Z(u,v) 同态滤波函数用H(u,v) 处理Z(u,v) (4)s(x,y) = F-1S(u,v) = i(x,y) + r(x,y) (5)g(x,y) = exp s(x,y)= exp i(x,y) + r(x,y)= i0(x,y) r0 (x,y) i(x,y)照射分量,低频区,r(x,y)反射分量,反映图

14、像的细节分量,处于高频区,同态增晰,a)同态滤波处理前 b)同态滤波处理后 (压缩图像的动态范围,增加了图像各部分之间的对比度),同态增晰,第六章 图像复原,常见退化图像,由于镜头聚焦不好引起的模糊,由于镜头畸变引起图像的几何失真,常见退化图像,由于运动产生的模糊,常见退化图像,图像退化与复原,图像在形成、传输和记录过程中,由于成像系统、传输介质和设备的不完善,使图像的质量变坏,这一过程称为图像的退化。 图像的复原就是要尽可能恢复退化图像的本来面目,它是沿图像降质的逆向过程进行。典型的图像复原是根据图像退化的先验知识建立一个退化模型,以此模型为基础,采用各种逆退化处理方法进行恢复,使图像质量得

15、到改善。 必须知道噪声的统计特性以及噪声和图像信号的相关情况,这是非常复杂的。在实际应用中,往往假设噪声是白噪声,即它的频谱密度为常数,且与图像不相关。 不同的复原技术需要不同的有关噪声的先验信息,如下面将要讨论的维纳滤波器需要知道噪声的谱密度,而约束去卷积法只需要知道噪声的协方差。,退化模型,退化过程可以被模型化为一个退化函数和一个加性噪声项,处理一幅图像f(x,y)产生一幅退化图像g(x,y)。图像复原的目的是获得原始图像的一个近似估计 。,噪声,高斯(Gaussian)噪声 瑞利(Rayleigh)噪声 伽马(爱尔兰)噪声 指数(Exponential)噪声 均匀(Uniform)噪声

16、脉冲(椒盐)噪声,噪声,高斯 瑞利 伽马,噪声,高斯 瑞利 伽马,指数 均匀 椒盐,当一幅图像中唯一存在的退化是噪声时,退化模型变为: 在这一特殊情况下,可以选择空间滤波方法。可选用均值滤波方法减 少噪声进行图像复原。,仅有噪声存在下的空间滤波复原,算术均值滤波器:简单平滑了一幅图像 的局部变化,其对图像的复原效果最差。,几何均值滤波: 相对于算术均值滤波平滑 度差不多,但图像的细节丢失更少。算 术均值滤波器和几何均值滤波器适于处 理高斯或均匀分布噪声。,滤波效果对比,a)原图 b)叠加了高斯 噪声的图像 c)3*3算数均值 滤波 d)3*3几何均值 滤波 对噪声衰减都有 作用,但几何均 值滤

17、波比算术均 值滤波减少了对 图像的模糊,仅有噪声存在下的空间滤波复原,谐波均值滤波器: 对于“盐” 噪声效果较好,但 不适于“胡椒”噪声。它善于处理高斯噪声。,逆谐波均值滤波器: Q成为滤波器的阶数。当Q为 正数时,滤波器消除胡椒噪声;当Q为负值时,滤 波器消除盐噪声;当Q=0,逆谐波滤波器退化为算 术均值滤波器;当Q=-1时,逆谐波均值滤波器变 为谐波均值滤波器。谐波均值滤波器适于处理脉 冲噪声,但必须知道噪声是暗噪声还是亮噪声, 以便于选择合适的Q符号。,滤波效果对比,a)叠加了胡椒 噪声的图像 b)叠加了盐 噪声的图像 c)对a) 3*3 Q=1.5 逆谐波滤波 d) 对b) 3*3 Q

18、=-1.5 逆谐波滤波 正阶滤波器在使 暗区模糊的损失 下,使背景较为 清晰。 负阶相反。,复原效果,a) 被正弦噪声干扰的图像 b) 滤波效果图 用巴特沃思带阻滤波器复原受正弦噪声干扰的图像,复原效果,a)受大气湍流的严重影响的图像 b)用维纳滤波器恢复出来的图像 维纳滤波器应用,仅有噪声存在下的空间滤波复原,中值滤波器:适于处理椒盐噪声,通过多次使用小模板,可以获得很好的去噪效果。 最大值滤波器:这种滤波器对发现图像中的最亮点非常有用,可以用来消除胡椒噪声。 最小值滤波器:这种滤波器对发现图像中的最暗点非常有用,可以用来消除盐噪声 中点滤波器:取最大值和最小值的平均值。对高斯和均匀随机分布

19、的噪声有效。 修正后的阿尔法均值滤波器: 邻域内去掉d/2个最大值和d/2个最小值后剩余的mn-d个像素。由这些点的平均值形成的滤波器称为修正后的阿尔法均值滤波器。,中值滤波结果,a)Pa=Pb=0.1的椒盐 噪声污染后图像 b)3*3中值滤波处理后图像 c)用同样的滤波器处理b)的结果 d)用同样的滤波器处理c)的结果 过度重复使用中值滤波可能会对图像造成模糊,最大值与最小值滤波结果,a)Pa=0.1的胡椒噪声污染后图像 b)Pb=0.1的盐噪声污染后图像 c)3*3最大值滤波处理后图像 d) 3*3最小值滤波处理后图像 最大值滤波器移除了一些暗像素 最小值滤波器则移除一些亮像素,由加性均匀

20、噪声污染的图像 均值为0,方差为800的高斯噪声 (b) 图(a)加上椒盐噪声污染的图像 Pa=Pb=0.1得椒盐噪声 (c) 55的算术均值滤波处理图(b) (d) 几何均值滤波器处理图(b) (e) 中值滤波器处理图(b) (f) d=5的修正后的阿尔法均值滤波器,(a),(b),(c),(d),(e),(f),由于脉冲噪声的存在,算术均值滤波器和几何均值滤波器没有起到良好作用. 中值滤波器和阿尔法滤波器效果更好,阿尔法最好.,修正后的阿尔法滤波,自适应局部噪声消除滤波器,a)由0均值和方差为1000的加性高斯噪声污染的图像 b) 7*7算术均值滤波处理后图像 c) 7*7几何均值滤波处理

21、后图像 d) 7*7自适应噪声消除滤波器处理后图像 自适应滤波器是基 于m*n矩形窗区域图 像的统计特性而变 化的,其性能优于 前面所讨论的滤波 器;代价是滤波器 的复杂度增加了。 滤波效果与算术、几何均值滤波器相近,但图像更尖锐些。,自适应中值滤波器,Zmin窗口区域灰度级的最小值 Zmax窗口区域灰度级的最大值 Zmed窗口区域灰度级的中值 Zxy 坐标(x,y)上的灰度级 SmaxSxy允许的最大尺寸,A: A1=Zmed-Zmin A2=Zmed-Zmax 如果A10,且A20且B20,输出Zxy 否则输出Zmed,a)Pa=Pb=0.25的椒盐噪声污染的图像 b) 7*7中值滤波处理

22、后图像 c) Smax=7的自适应中值滤波处理后图像,噪声去除水平 与中值滤波效 果相近,但图 像保持了点的 尖锐性及其细 节。,频域滤波消减周期噪声,(a) 被正弦噪声污染的图像 (b) 图(a)的频谱 (c) 巴特沃思带阻滤波器 (d) 滤波效果图,频域滤波消减周期噪声,(a) 佛罗里达和墨西哥湾的人造 卫星图像. (b) (a)图的频谱 (c) 叠加在(b)图的陷波带通滤波器 (d) 滤波后图像的反傅立叶变换,在 空间域显示噪声模式 (e) 陷波带阻滤波器效果,估计退化函数,图像观察估计法: 观察包含简单结构的一小部分图像,为减少观察时的噪声影响,可以寻找强信号内容区。使用目标和背景的样

23、品灰度级,可以构建一个不模糊的图像 。该图像和看到的子图像有相同的大小和特性。 表示观察的子图像, 表示构建的子图像 实验估计法:如果可以使用与获取退化图像的设备相似的装置,理论上得到一个准确的退化估计是可能的。与退化图像类似的图像可以通过各种系统设置得到,退化这些图像使其尽可能接近希望复原的图像。利用相同的系统设置,由成像一个脉冲得到退化的冲激响应。 模型估计法:使用常用的退化模型,把引起退化的环境因素考虑在内。例如Hufnagel和Stanley1964提出的基于大气湍流的物理模型。,模型化的另一个主要方法是从基本原理开始推导一个数学模型。例如,图像获取时被图像与传感器之间的均匀线性运动模

24、糊了,假设图像f(x,y)进行平面运动,x0(t)和y0(t)分别是在x和y方向上相应的随机变化的运动参数。那么在记录介质任意点的曝光总数是通过对时间间隔内瞬时曝光数的积分得到的,在该时间段内,图像系统的快门是开着的。假设快门的开启和关闭所用的时间非常短,那么光学成像过程不会受到图像运动的干扰,如果设T为曝光时间,结果为:,估计退化函数,估计退化函数,(a)原始图像 (b)运动模糊后的图像,运动位移为30个象素 运动角度为45o,基于大气湍流模型复原,a)可忽略的湍流 b)剧烈湍流 k=0.002 5 c)中等湍流 k=0.001 d)轻微湍流 k=0.000 25,逆滤波,n未知,寻求f,使

25、得Hf 在最小二乘意义上来说近似于g,即最小化,当M=N时,H为一方阵,且假设H-1存在,逆滤波,H(u,v)=0或很小,N(u,v)不为0 难以计算或者比F(u,v)大得多,问题:恢复出来的结果与预期结果相差很大,甚至面目全非,逆滤波结果,剧烈湍流图像的复原结果,a)用全滤波的复原结果 b)半径为40时的结果 c)半径为70时的结果 d)半径为85时的结果,半径为70时效果最好, 大于70时产生退化, 小于70时变得模糊。 这个例子的结果说明 直接进行逆滤波的结 果是较差的。,逆滤波改进,式中D0是逆滤波器的空间截止频率。一般选择D0位于 H(u,v)通带内某一适当位置使复原图像的信噪比较大

26、。,其中k和d均为小于1的常数,第七章 图像分割,图像分割举例,图像分割,图象分割就是指把图象分成各具特性的区域并提取出感兴趣目标的技术和过程。是图像识别和图像理解的基本前提步骤。 将图像表示为物理上有意义的连通区域的集合,也就是根据目标与背景的先验知识,对图像中的目标、背景进行标记、定位,然后将目标从背景或其他伪目标中分离出来。由于这些被分割的区域在某些特性上相近,图像分割常用于模式识别与图像理解以及图像压缩与编码两大类不同的应用目的。,图像分割策略,图像分割的基本策略是基于灰度值的两个基本特性: 区域之间的不连续性。 边界方法,这种方法假设图像分割结果的某个子区域在原来图像中一定会有边缘存

27、在。 先找到点、线(宽度为1)、 边(不定宽度) 再确定区域 区域内部的相似性 区域方法,这种方法假设图像分割结果的某个子区域一定会有相同的性质,而不同区域的像素则没有共同的性质。 通过选择阈值,找到灰度值相似的区域。区域的外轮廓就是对象的边。,点检测,用空域的高通滤波器来检测 孤立点: R= (-1 * 8 * 8 + 128 * 8)/9=106 可以设置阈值T = 64 若R=0,则说明检测点与周围点像素值相同 若R T,则说 明检测点与周 围点像素值非 常的不同,为 孤立点,点检测,汽轮机叶片对应的X光图像,点检测的结果,改变阈值的结果,线检测,通过比较典型模板的计算值,确定一个点是否

28、在某个方向的线上 模板系数之和为0,感兴趣的方向系数值较大,R水平 = -6 + 30 = 24 R45度 = -14 + 14 = 0 R垂直 = -14 + 14 = 0 R135度 = -14 + 14 = 0,边缘检测,边缘是位于两个区域的边界线上的连续像素集合 边缘上的这种变化可以通过微分算子进行检测: 一阶导数:通过梯度来计算,检测图像中边的存在。 对于亮的边,边的变化先正后负的。对于暗边,结论相反。常数部分为零。,边缘检测,二阶导数:通过拉普拉斯算子来计算,确定边上的像素是在亮的一边,还是暗的一边,0用于确定边的准确位置 二阶微分在亮的一边是正的,在暗的一边是负的。常数部分为零。

29、 基于微分的边缘检测器,其基本依据是图像的边缘对应了一阶导数 的极大值,而二阶导数则过零点。,边缘检测算子,Laplacian,高斯拉普拉斯(LOG),Laplacian由于对噪声太敏感,因此一般不单独使用。通常和平滑Gaussian滤波器进行结合来进行边缘检测。高斯拉普拉斯滤波器使用了Gaussian来进行噪声去除并使用 Laplacian来进行边缘检测,高斯拉普拉斯举例,A原图; B.Sobel C.高斯函数 D.拉普拉斯模板 E.Log F.对log设门限 G.过零点,边缘检测举例,边缘检测中经常碰 到的问题是:图像 中存在太多的细节。 如例子中的砖墙。 图像受到噪声的干 扰,不能准确的

30、检 测边缘。 解决的一个方法是在 边缘检测之前对图像 进行平滑,平滑后的边缘检测举例,轮廓跟踪与提取,轮廓跟踪:按顺序找出边缘点来跟踪边界 步骤1: 扫描图像, 寻找A0。初始化扫描方向变量dir(记录上一个边界点到当前边界点的移动方向)。 步骤2: 按逆时针方向搜索当前像素的33邻域,搜索到的第一个与当前像素值相同的像素便为新的边界点An,同时更新变量dir为新的方向值。 (1) 对4连通区域取dir = 3,取(dir + 3)mod 4。 (2) 对8连通区域取dir = 7。若dir为奇数取(dir + 7)mod 8, 若dir为偶数取(dir + 6) mod 8。,dir=0 (

31、0+3) mod 4 =3,dir=1 (1+3) mod 4 =0,dir=2 (2+3) mod 4 =1,dir=3 (3+3) mod 4 =2,轮廓跟踪与提取,步骤3:如果An等于第二个边界点A1且边界点An-1等于第一个边界点A0,则停止搜索,结束跟踪,否则重复步骤2继续搜索。 步骤4:由边界点A0、A1、A2、An-2构成的边界便为要跟踪的边界。 轮廓提取:如果原图像中有一点为黑,且它的8个邻点都是黑色时,说明该点是内部点, 将该点删除。,基于灰度阈值的分割方法,常用的方法是求解灰度直方图中的双 峰或者多峰,并以两峰之间的谷底作 为阈值。,基于灰度阈值的分割方法举例,基本的全局阈

32、值算法,全局阈值是指整幅图像使用同一个阈值做分割处理,并产生一个二值图,区分出前景对象和背景。适用于背景和前景对比度大的图像 算法实现: 选取一个合适的阈值T,逐行扫描图像 凡灰度级大于T的,颜色置为255;凡灰度级小于T的,颜色置为0 基本的全局阈值T可以按如下计算: 1、选择一个初时估计值T (一般为图像的平均灰度值) 2、使用T分割图像,产生两组像素:G1包括灰度级大于T的像素,G2包括灰度级小于等于T的像素 3、计算G1 中像素的平均值并赋值给1,计算G2 中像素的平均值并赋值给2 4、计算一个新的阈值: 5、重复步骤 2 4,一直到两次连续的T之间的差小于预先给定的上界T,阈值法举例

33、,单值阈值只能对双峰直方图工 作得较好。对于其它类型的直方 图,需要更多的阈值,单值阈值和光照,不均匀的光照会使单值阈值方案失效。解决单值阈值无法工作的一个方法是将图像分割为子图像,并分别进行阈值化处理 由于每个像素的阈值依赖于其在图像中的位置,因此称为自适应(adaptive)阈值,我们看到图像得到了改善,但是需 要对出错的图像进行进一步的细分, 从而得到更好的效果。,区域生长,基本思想:将相似象素结合起来构成区域 基本步骤: (1) 选择区域的种子象素 (2) 确定将相邻象素包括进来的准则 (3) 制定生长停止的规则 生长示例 (1) 根据直方图选取聚类中心的象素为种子 (2) 根据与种子

34、象素灰度差(T)判断是否生长 (3) 根据图象边缘确定生长何时终结 原始图 T = 3 T = 2 T = 7,区域生长举例,图像分裂与聚合,原始图像,一次分裂,二次分裂,聚合,算法总结为:,(1)对任一区域Ri,若区域的特征值(如,灰度值)差别比较大,则分裂成不重叠的4等分;,(2)对相邻两个区域,若区域的特征值相似,则将他们合并起来;,(3)如果进一步的分裂或聚合都不可能了,则结束。,分水岭分割,灰度图像的分水岭算法,就是就灰度值模拟为山的高度。从低到高,分别代表山岭从盆地到分水岭的高度。基于这些概念的分割算法的主要目的是找出分水线。基本思想是:假设在每一区域的最小值的位置上打一个小洞并让

35、水均匀上升速率从洞中涌出,从低到高掩模真个地形。当处在不同汇水盆地的水要聚合在一起时,修建大坝将阻值聚合。当水继续上升,当水面淹没说有分水岭时,大坝对应的边界,就是分水岭算法的分割线。,分水岭分割举例,Hough变换,Hough(霍夫)变换可以用于将边缘 像素连接起来得到边界曲线,它 的主要优点在于受噪声和曲线间 断的影响较小 Hough变换的基本思想: 在xy平面内的一条直线可以表示为: 将a、b作为变量,ab平面内直线可以表示为: 如果点(x1,y1)与点(x2,y2)共线,那么这两点在参数ab平面上 的直线将有一个交点 在参数ab平面上相交直线最多的点,对应的xy平面上的直线就是我们的

36、解。这种从线到点的变换就是Hough变换。,Hough变换,由于垂直直线的斜 率a为无穷大,因 此计算量会非常 大,我们改用极坐 标形式: 参数平面为, 对应不是直线而是正弦曲线 找出相交线段最多的参数空间的点,再根据该点求出对应的xy平面的直线段,应用Hough变换对倾斜表格图像纠偏,(a) 倾斜的表格图像 (b) 对(a)二值化,(c)Hough变换累加数组 (d)最长直线的角度纠正倾斜图像,p,q,o,第八章 图像编码,研究背景,对于电视画面的分辨率640*480的彩色图像,每秒30帧,则一秒钟的数据量为:640*480*24*30=221.12M 所以播放时,需要221Mbps的通信回

37、路。 在宽带网上(10M)实时传输的话,需要压缩到原来数据量的0.045。 1张CD可存640M。如果不进行压缩,1张CD则仅可以存放2.89秒的数据。存2小时的信息则需要压缩到原来数据量的0.0004。 传输带宽、速度、存储器容量的限制。给我们带来的一个难题,也给了我们一个机会: 如何用软件的手段来解决硬件上的物理极限?,数据冗余,在下面的例子中,用一种最好的方式来发送一封电报。 你的妻子,Helen,将于明天晚上6点零5分在上海的虹桥机场接你。 (23*2+10=56个半角字符) 你的妻子将于明天晚上6点零5分在虹桥机场接你 (20*2+2=42个半角字符) Helen将于明晚6点在虹桥接

38、你 (10*2+6=26个半角字符),结论:只要接收端不会产生误解,就可以减少承载信息的数据量。,“这是一幅2*2的图像,图像的第一个像素是 红的,第二个像素是红的,第三个像素是红的, 第四个像素是红的”。 “这是一幅2*2的图 像,整幅图都是红色的”。,由此我们知道,整理图像的描述方法可以达到压缩的目的。,图像冗余,从16*3*8=284bits压缩为:(1+3)*8=32bits,(248,27,4),(251,32,15),(248,27,4),(248,27,4),视觉冗余,图像的压缩编码,因为有数据冗余,当我们将图像信息的描述方式改变之后,可以压缩掉这些冗余。 因为有主观视觉冗余,当

39、我们忽略一些视觉不太明显的微小差异,可以进行所谓的“有损”压缩。 第一代压缩编码 八十年代以前,主要是根据传统的信源编码方法。 第二代压缩编码 八十年代以后,突破信源编码理论,结合分形、模型基、神经网络、小波变换等数学工具,充分利用视觉系统生理心理特性和图像信源的各种特性。,图像的压缩编码,图像压缩的分类,评价标准,保真度标准评价压缩算法的标准 客观保真度标准:图像压缩过程对图像信息的损失能够表示为原始图像与压缩并解压缩后图像的函数。 一般表示为输出和输入之差: 两个图像之间的总误差: 均方根误差: 主观保真度标准:通过视觉比较两个图像,给出一个定性的评价,如很粗、粗、稍粗、相同、稍好、较好、

40、很好等,可以对所有人的感觉评分计算平均感觉分来衡量,行程编码(RLE编码),行程编码是一种最简单的,在某些场合是非常有效的一种无损压缩编码方法。通过改变图像的描述方式,来实现图像的压缩。 行程编码要获得好的压缩率的前提是有比较长的相同值的相邻像素。 将一行中灰度值相同的相邻像素,用一个计数值和该灰度值来代替。 aaaa bbb cc d eeeee fffffff (共22*8=176 bits) 4a3b2c1d5e7f (共12*8=96 bits) 压缩率为:96/176=54.5% 传真件中一般都是白色比较多,而黑色相对比较少。所以可能常常会出现如下的情况: 600W 3b 570w

41、12b 4w 3b 3000w 因为:204830004096 所以:计数值必须用12 bit来表示 上面的行程编码所需用的字节数为: 12*7=84 bit 既然已经可以预制知白色多黑色少,可以对白色和黑色的计数值采用不同的位数。可以定义:白色:12 bit,黑色:4 bit 所需字节数为:4*12+3*4=60bit 比原来的RLE方式减少了60bit,相当于压缩比提高到60/120=50%。,在256色PCX文件中,行程长度和行程的代表值分别占一字节,且规定编码时的最大行程长度为63,如果行程长度大于63,则必须分多次存储。设行程长度为L,有以下三种情况: (1)163:必须多次存储。计

42、算整数n=L/63,存入 n个长度值(为63,加192后十六进制数为FF)和像素值,最后存入L/63的余数长度及像素值。例如,连续130个灰度值为0x50的像素,其编码(以十六进制表示)应为FF 50 FF 50 C4 50。,PCX文件中的行程编码,对以下256色PCX文件中的一行图像压缩数据(十六进制数) 进行解码: CA 53 12 C1 34 FF 40 E2 40 第一个字节0xCA0xC0,则为行程长度L=10; 第二个字节为像素值83; 第三个字节0x120xC0, 则为行程长度L=63; 第五个字节为像素值64; 第六个字节0xE20xC0, 则为行程长度L=34; 第七个字节

43、为像素值64。 因此最终解码结果为: 10个像素值为83、1个像素值为18、97个像素值为64。,PCX文件中的行程编码,Huffman 编码(熵编码),aaaa bbb cc d eeeee fffffff 4 3 2 1 5 7 如果不进行特殊的编码,需要的数据量为: 22*8=176 bits,7*2+5*2+4*2+3*3+2*4+1*4=53 bit 压缩率为30.1%。,Huffman编码效率示例,8*8分块的编码效率为47.27%,16*16分块的编码效率约为61%,全图的编码效率为91.47%,将图像分割成若干的小块,对每块进行独立的Huffman编码。 就可以大大降低不同灰度

44、值的个数,香农-范诺编码,香农-范诺编码的理论基础是符号的码字长度Ni完全由 该符号出现的概率来决定,即 编码步骤: (1)首先将编码字符集中的字符按照出现频度和概率进行排序。 (2)用递归的方法分成两部分,使两个部分的概率和接近于相等。给前一个子集合赋值为0,后面的赋值为1直至不可再分,即每一个叶子对应一个字符。 (3)编码(从根结点开始)。 如:设一副灰度级为8的图象中,各灰度所对应的概率分别为0.04,0.05,0.06,0.07,0.10,0.10,0.18,0.40,现在对其进行二分法香农范诺编码?,s0,s1,s2,s3,s4,s5,s6,s7,s2,s3,s4,s5,s6,s7,

45、s0,s1,0.58,0.42,s2,s3,s4,s5,s6,s7,s0,s1,s4,s5,s6,s7,s2,s3,s4,s5,s6,s7,s0,0.40,s1,s2,s3,s4,s5,s6,0.18,0.10,0.10,0.07,s7,0.06,0.05,0.04,0.20,0.22,0.13,0.09,0,1,0,1,0,1,0,1,0,1,0,1,0,1,S0: 00,S1: 01,S2: 100,S3: 101,S4: 1100,S5: 1101,S6: 1110,S7: 1111,香农-范诺编码,LZW编码,LZW(Lempel-Ziv & Welch)编码又称字串表编码,属于一种无

46、损编码,它在编码的同时还生成了特定字符串以及与之对应的索引字符串表。 LZW压缩使用字典库查找方案。它读入待压缩的数据并与一个字典库(库开始是空的)中的字符串对比,如有匹配的字符串,则输出该字符串数据在字典库中的位置索引,否则将该字符串插入字典中。 步骤1:将词典初始化为包含所有可能的单字字符,当前前缀P初始化为空。 步骤2:当前字符C:=字符流中的下一个字符。 步骤3:判断PC是否在词典中。如果“是”,则用C扩展P,即让P:=PC;如果“否”,则输出与当前前缀P相对应的码字;将PC添加到词典中;令P:=C,现在的P仅包含一个字符C 步骤4:判断码字流中是否还有码字,如果“是”,就返回到步骤2

47、;如果“否”,把代表当前前缀P的码字输出到码字流;结束。,LZW编码举例,输入数据流:,编码过程:,DCT变换,正变换:,逆变换:,其中:,DCT变换编码,DCT变换,DCT逆变换,原图像,除以量化矩阵,取整,1)编码过程:,2)解码过程:,压缩图像,乘以量化矩阵,取整,压缩 图像,解压 图像,DCT变换编码,Huffman:42bits; 编码效率32.8%,Huffman:16bits; 编码效率:12.5%,例:,原图像为:,除以量化矩阵,取整,DCT变换编码,原图,解压图,小波变换编码,利用小波变换实现图像数据压缩常用的方法有: 零树编码的基本思想是将对小波变换系数的编码分解为对标志系

48、数特性的 系数重要性图的编码和对重要系数的幅度编码两部分,利用不同尺度的小 波系数间存在的较强的相关性,将多数的零系数组织成一种树形结构,从 而提高了总体编码效率。 重要系数树编码的基本思想是给定一个小波系数和一个适当的阈值T ,如果 小于T,我们说该系数是不重要的,可将其看作零;否则,是重 要的,即 需要对其值进行编码。于是,每个小波系数都被赋予这样一个 属性,而每 个不同尺度的子图像都对应这样一幅由属性构成的图,这就是系数重要性图。,JPEG 编 码,JPEG是面向静态图像编码的国际标准。JPEG文件拥有比其他图像文件格式更高的压缩比。JPEG目前被广泛应用于多媒体和网络中,是现今万维网中使用最广泛的两种图像文件格式之一。JPEG是一种有损压缩,在压缩过程中会丢失数据,每次编辑JPEG图像后,图像就会被重复压缩一次, 损失就会有所增加。 (1)将彩色图像颜色模型变为YUV模型 YUV是现代彩色电视系统通常采用的色彩模型,如果只有Y信号分量而没有U、V分量,表示的图像就是黑白灰度图像。YUV与RGB相互转换的公式如下(RGB取值范围均为0-255): Y = 0.299R + 0.587G + 0.114B U = -0

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1