毕业设计(论文)-人耳人脸融合识别系统预处理模块设计.doc

上传人:yyf 文档编号:3281905 上传时间:2019-08-07 格式:DOC 页数:62 大小:893.02KB
返回 下载 相关 举报
毕业设计(论文)-人耳人脸融合识别系统预处理模块设计.doc_第1页
第1页 / 共62页
毕业设计(论文)-人耳人脸融合识别系统预处理模块设计.doc_第2页
第2页 / 共62页
毕业设计(论文)-人耳人脸融合识别系统预处理模块设计.doc_第3页
第3页 / 共62页
毕业设计(论文)-人耳人脸融合识别系统预处理模块设计.doc_第4页
第4页 / 共62页
毕业设计(论文)-人耳人脸融合识别系统预处理模块设计.doc_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《毕业设计(论文)-人耳人脸融合识别系统预处理模块设计.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)-人耳人脸融合识别系统预处理模块设计.doc(62页珍藏版)》请在三一文库上搜索。

1、人耳人脸融合识别系统预处理模块设计院 系自动化学院专 业自动化班 级学 号姓 名指导教师负责教师沈阳航空工业学院2009年6月沈阳航空工业学院毕业设计(论文)摘 要生物特征识别推向大规模实际应用的趋势和需求,使得多模态生物特征识别技术成为生物特征识别领域的研究和应用热点。基于多模态生物特征融合进行身份鉴别可以实现多种生物特征的优势互补,从而在提高准确率、扩大适用范围、增强系统可靠性等方面提高生物特征识别系统的性能,使之更接近实用。目前,人耳人脸融合识别已成为当前多模态识别的研究热点。在人耳人脸融合识别系统中,人耳人脸图像的预处理占有十分重要的地位,图像预处理的好坏直接影响人耳人脸融合识别系统识

2、别的正确率。本课题的主要内容是设计人耳人脸融合识别系统的预处理模块。人脸图像预处理模块采用基于代数特征的方法;人耳图像预处理模块也采用基于代数特征的方法,但需借助PCA的识别方法来验证人耳图像的预处理效果。关键词:人耳人脸融合识别;生物特征识别;图像预处理;代数特征;几何特征;AbstractThe trends and needs of biological identification to the large-scale practical application, make multi-modal biological identification technology as the

3、research and application highlight in the field of biological identification. identification based on multi-modal biological feature integration can realize predominance complement in a variety of biological characteristics. And this technology can improve the accuracy and expand the scope of applic

4、ation, and enhance system reliability and the forth, which can improve the performance of the identification system and make it more practical. At present, integration of the human ear Face recognition has become hot spot in the study of multi-modal identification. the human ear face image preproces

5、sing is of great important status in the field of the human ear face integration identification , image pre-processing has a direct impact on the accuracy of human ear face integration Identification System.The main content of this issue is to design preprocessing module of the human ear face integr

6、ation Recognition System. Face image preprocessing module is based on the algebra features, and the human ear image pre-processing module is based on the algebra features too, but which utilize PCA identification method to verify the results of human ear image preprocessing.Keywords: integration of

7、the human ear Face recognition; biological identification; image pre-processing; algebra features; geometrical features;目 录第1章 绪 论11.1 课题背景11.2 课题任务及要求21.3 论文安排2第2章 人耳人脸融合识别系统预处理相关知识32.1 图像增强32.1.1 灰度变换修整法32.1.2 直方图修整法52.2图像变换72.2.1 图像平移82.2.2 图像的缩放92.3 图像恢复102.4 图像分割14第3章 人耳人脸融合识别系统预处理模块的总体方案论证173.

8、1人耳人脸融合识别系统173.2 人耳人脸融合识别系统预处理模块的设计173.2.1 人脸图像预处理模块设计183.2.2 人耳图像预处理模块223.3人耳人脸融合识别系统的实现环境233.3.1面向对象编程语言介绍233.3.2 VC+语言及其特点23第4章 人耳人脸融合识别系统预处理模块方案实现244.1人脸图像预处理模块设计244.1.1 去噪声处理244.1.2 人脸区域基于肤色模型的分割264.1.3 二值化294.1.4 水平直方图304.1.5 垂直直方图314.2 人耳图像预处理模块设计334.2.1 高斯平滑334.2.2 灰度均衡344.2.3 直方图修整364.2.4 图

9、像缩放36第5章 人耳人脸融合识别系统预处理模块的调试及结果分析395.1 调试分析395.2 故障的调试及解决方法395.3 调试结果395.3.1 人脸图像预处理模块调试405.3.2 人耳图像预处理模块调试415.4 结果分析435.4.1 人脸图像预处理模块图像处理结果分析435.4.2 人耳图像预处理模块图像处理结果分析43结论45社会经济效益分析46参考文献47致 谢4957- -第1章 绪 论1.1 课题背景在信息化高度发展的当今社会,随着科学技术的突飞猛进、计算机及网络技术的高速发展,信息的安全性、隐蔽性越来越重要。而网络信息化时代的一大特征就是身份的数字化和隐性化,如何有效、

10、方便地进行身份验证和识别,已经成为人们日益关心的问题,也是当今信息时代必须解决的一个关键的社会问题。传统的身份验证和识别方法包括:身份证、工作证、智能卡、密码、口令等存在携带不便、容易遗失、或者由于使用过多或不当而损坏、不可读和密码易被破解等诸多问题。因此,目前广泛使用的依靠证件、个人识别号码、口令等传统方法来确认个人身份的技术面临着严峻的挑战,并越来越不适应现代科技的发展和社会的进步。我们需要更方便、更可靠、更安全的身份验证和识别方式。于是,人们开始寻找一种认人不认物的直接验证方法,即“生物特征身份识别技术”。生物特征识别就是指通过计算机利用人类本身的、能够唯一标识其身份的生理特征或者行为特

11、征来进行身份识别和(或)个体验证的技术,与传统技术相比生物特征识别技术具有不易被遗忘或丢失、防伪性能好、随身携带等优势,被认为是具有良好发展前景的安全识别与验证技术。而基于生物特征识别技术的个人身份识别系统具有更好的安全性、可靠性和有效性,己经开始取代传统的身份识别技术,成为新的学术研究和应用重点。早期的生物特征识别的研究主要集中于单一模态的生物特征,取得了很多的研究和应用成果,但由于种种局限性,效果却不尽如人意。随着对社会安全和身份鉴别的准确性和可靠性要求的日益提高,单一的生物特征识别己远远不能满足社会的需要,进而阻碍了该领域更广泛的应用。由于没有任何一个单一的生物特征识别系统能提供足够的精

12、确度和可靠性,因此,多模态生物特征识别系统的出现是一个可选的策略。多模态生物特征识别利用了多种生物特征更加丰富的信息,可以实现多种生物特征体的优势互补,从而改善系统的抗噪性、大规模数据库性能衰减程度、普适性、抗假冒攻击等多方面性能,实现更为鲁棒的系统,具有良好的应用前景。近年来,采用人脸与其他生物特征体融合己成为当前多模态生物特征识别技术的研究热点。但人脸同指纹、虹膜、手形等的融合,往往破坏了人脸识别所具有的非打扰识别的特点。分析己有研究成果,可以发现在当前人脸自动识别技术中绝大多数都没有考虑耳部区域信息。研究表明,由于人耳的生理特征结构、位置及其唯一性和稳定性的特点,使人耳识别成为一种与人脸

13、、虹膜识别等同样重要、可相互补充和结合的识别技术。鉴于人耳和人脸在生理位置上所具备的特定关系,人耳识别的发展应同人脸识别相结合,通过多生物特征的融合识别,最终实现非打扰式识别。人耳与人脸融合的多模态生物特征识别技术可以充分利用二者在生理位置上的特殊关系,不仅能够继续保持非打扰身份鉴别的特点,而且具有更多可利用的鉴别信息。把人耳和人脸信息有效地融合起来,将有助于扩大有效识别范围,实现无需被识别对象配合的非打扰式识别,从而使得多模态识别系统具有更高的实际应用价值,应用于更广泛的场合。1.2 课题任务及要求人耳人脸融合识别是一种新的生物特征融合识别方法,通过实验表明,两种特征的融合,可以提高识别系统

14、的准确性和鲁棒性。本设计基于VC环境下设计实现一套人耳人脸融合识别系统的预处理模块,该模块主要完成常用的人脸人耳识别系统的预处理方法,为人耳人脸识别的研究提供预处理方法的比较平台。并且通过适当的修改,可以进一步扩充推广,满足实际需要。该系统包括(1) 图像的输入,图像的简单预处理。(2) 图像的预处理模块。(3) 简单的特征提取和分类方法。1.3 论文安排本文对人耳人脸融合识别系统预处理模块设计进行了详细的介绍,共分5章。第1章简要介绍了整个课题的研究背景及整个任务的要求安排;第2章阐述了一些图像预处理的相关知识;第3章是针对此次课题的任务进行方案论证,介绍了该方案的设计环境以及系统所包含的主

15、要部分;第4章具体阐述了人耳人脸融合识别系统预处理模块的设计,包括图像预处理模块流程图及其主要程序源代码;第5章主要对所设计的程序进行调试,并对结果进行分析。第2章 人耳人脸融合识别系统预处理相关知识图像的预处理包括图像增强、图像变换、图像恢复、图像分割等。本章将对以上几种方法进行详细阐述。2.1 图像增强图像增强是图像预处理的基本内容之一。图像增强是指按特定的需要突出一幅图像中的某些信息,同时削弱某些不需要的信息的处理方法。其主要的目的是使处理后图像对某种特定的应用来说,比原始图像更适用。为此,这类处理是为了某种应用的目的而去改变图像质量的。处理的结果使图像更适合人的视觉特性或机器的识别系统

16、。图像增强的主要内容如图2-1所示,图2-1 图像增强的主要内容2.1.1 灰度变换修整法直接修改图像像素点的灰度级是一种简单而有效的增强运算。它主要有两种形式:一种是灰度级校正,它是修改个别图像像素点的灰度级以补偿原来记录图像的某些缺陷(如不均匀曝光等);另一种形式为灰度级映射变换,其目的在于以统一的放大改变整个图像的灰度或改变图像的一些区域的灰度,以便能增加对比度,从而能使感兴趣的图像细节更容易看清。这里主要针对后者展开详细讨论。1. 灰度变换修整法基本原理照片或用电子方法得到的图像,例如光照片或陆地卫星多光谱图像,其对比度通常很差,为此需要对图像中的每个像素的灰度级进行标度变换,扩大图像

17、灰度的范围,以达到图像增强的目的。标度原始图像中像素点处的灰度级为,通过映射函数映射成输出图像中的灰度级,即。根据映射函数的不同定义方法,灰度变换修整法主要包括下面两种方法。1) 线性灰度变换当图像由于成像时曝光不足或过度,以及成像、记录设备的非线性动态范围太窄等因素,都会产生对比度不足的弊病,使图像中的细节分辨不清。这时如将图像灰度线性扩展,常能显著改善图像的观看质量。假定源图像的灰度范围为,希望变换后的图像的动态范围为,则可用下述变换实现: (2.1)如果已知图像的大部分像素的灰度级分布在区间,小部分像素灰度级不在此区间内,则可采用下列变换改善图像的效果。 (2.2)2) 非线性灰度变换当

18、用某些非线性函数,例如对数、指数函数等作为映射函数时,可实现图像灰度的非线性变换。对数变换一般为: (2.3)a, b, c是可调参数。当希望对图像的低灰度区有较大的扩展面对高灰度区压缩时,可采用此变换,它能使图像灰度的分布均匀,与人的视觉特性相匹配。指数变换的形式为: (2.4)这种变换能对图像的高灰度区给予较大的扩展。由前面分析可知其算法主要包括下面几部分:(1) 读入原始图像,对原始图像的像素灰度进行分析,找出其绝大部分像素的灰度级分布的区间。(2) 确定变换后图像像素灰度的动态范围,对256色BMP图像而言,其动态范围可以确定为0, 255。(3) 依据式(2.1)可依次完成对各像素的

19、灰度变换。2.1.2 直方图修整法图像直方图是图形处理中一种十分重要的图像分析工具,它描述了一幅图像的灰度级内容,任何一幅图像的直方图都包含了丰富的信息,从数学上来说图像直方图是图像各灰度值统计特性与图像灰度值的函数,它统计一幅图像中各个灰度级出现的次数或频率。 假设图像的灰度范围为,表示内所有灰度级出现的相对频率,显然是的函数,往往称的图形为图像的直方图。从图形上来看,它是一个二维图,横坐标表示图像中各个像素点的灰度级,纵坐标为各个灰度级上图像各个像素点出现的次数或概率。图2-2所示即为典型的图像灰度直方图。图2-2 典型的图像灰度直方图直方图修整法是图像灰度级变换的最常用的一种方法,其具体

20、应用有:医学方面为了改善射线操作人员的工作条件,可以应用低强度的射线曝光,但这样获得的光片灰度级集中在暗区,许多图像细节无法看清,判读困难,通过修正灰度级别分布在人眼合适的亮度区域,就可以使片中的细节,如筋骨、关节等清晰可见。另外还有一些非可见光成像的工业无损检查,军事公安侦察等照片的处理等。1. 直方图修整法基本原理为了研究方便,往往先将直方图归一化,即让源图像灰度范围归一化为。设其中任一灰度级归一化为,变换后的图像的任一灰度级归一化为,显然,应当满足:因此直方图修整就是对下列公式的计算过程: (2.5)或 (2.6)式中为变换函数,它必须满足下列两个条件:(1) 在区域内是单值函数,且单调

21、增加。(2) 在区域内满足。条件(1)保证了在灰度级从黑到白的次序,而条件(2)保证变换的像素灰度级仍在允许的灰度级范围内。为逆变换函数,同样需要满足上面两个条件。假定用和分别表示源图像和变换后图像的灰度级概率密度函数,根据概率论的知识,在已知和时,且也是单增长,则可由下式求出: (2.7)可见,使用灰度直方图修整法进行图像增强技术的实质就是选用合适的变换函数来修整图像灰度级概率密度函数,从而得到灰度级具有分布的新图像。而直方图修整法实现图像增强中最常用的一种方法就是直方图的均衡化或者称之为均匀化。这是因为为了能从图像中获得尽量多的信息量,也就是使图像熵尽可能大,常常要求=常数,即所谓直方图均

22、匀化,也就是讲,图像中所有灰度出现频率相等的图像,所包含的信息最大。对直方图进行均衡化意味着=1,有公式(2.7)可得 (2.8)从而 (2.9)即为分布累计函数。对一幅数字图像而言,需引出离散形式的公式: (2.10)式中是图像灰度级数;是第个灰度级出现的概率;是图像中第个灰度级的像素数;是图像总像素数。为了进行直方图的均衡化处理,根据式(2.8)和式(2.9)可求得变换函数 (2.11)根据(2.11)式计算出各个像素点的根据良好的间隔归入各自的量化等级。由此可见灰度直方图均衡法实现图像处理的算法的核心内容包含下面两部分; 计算变换前图像各灰度值的计数,即得到直方图。 根据式(2.11)求

23、得变换后图像各灰度级对应的新灰度级即可得到各像素的灰度值。2.2图像变换本文主要介绍图像变换中的几何变换。图像的几何变换实质是使用户获得或设计的原始图像按照需要产生大小、形状和位置的变化。从图像类型来分,图像的几何变换有二维平面图像和三维图像的几何变换以及由三维向二维平面投影变换等。从变换的性质分,图像的几何变换有平移、比例放缩、旋转、反射和错切等基本变换,透视变换等复合变换,以及插值运算等。图像几何变换的一个重要应用是消除由摄像机导致的数字图像的几何畸变。当需要从数字图像中得到定量的空间测量数据时,几何校正是十分重要的。某些图像,例如,从卫星上或飞机雷达上得到的图像,都有相当严重的几何变形,

24、这些图像需要先经过几何校正,然后才能对其内容进行解释。一些图像系统使用非矩形极坐标的像素坐标,例如,极坐标、柱坐标、球面坐标等,用普通的显示设备观察这些图像时,必须先对它们进行校正,也就是说,将其转换为矩形像素坐标。例如,在油井套管缺陷识别中,有时需要将极坐标系中的内窥镜图像转换为直角坐标系中的图像,然后进行分析预处理。对于机器人的鱼眼透镜拍摄的变形严重的一幅图像,也可以设计一个适当的几何变换将其校正到矩形坐标系统,这样,可用立体视觉测距技术对机器人周围的物体进行三维空间定位。几何变换的另一个应用是对相似的图像进行配准,一边进行图像比较,典型的应用是利用图像相减来检测运动或变化。有时,为便于解

25、释需将图像以另一个样式表示,会用到几何变换,地图绘制中的图像投影也会用到几何变换。例如,在利用从宇宙飞船传回来的图像,拼成地球、月球及行星的航拍镶嵌地图时,就必须用几何变换。下面介绍几种常用的几何变换。2.2.1 图像平移图像平移只是改变图像在屏幕上的位置,图像本身不发生变化。是几何变换中最简单的一种。1. 基本原理图像平移只是改变图像在屏幕上的位置,图像本身不发生变化。假设源图像区域某像素点坐标为,平移后坐标变为。和的关系如下: (2.12)利用其次坐标,变换前后图像上的点和之间的关系可以用如下的矩阵变换表示为: (2.13)对变换矩阵求逆,可以得到式(2.13)的逆变换: (2.14)即:

26、 (2.15)综上所述,在屏幕上实现图像的移动分为4个步骤:(1) 保存源图像到缓冲区,并记录缓冲区地址。(2) 通过交互方式,设定偏移量。(3) 重新分配另一个同样大小的临时缓冲区。(4) 对源图的每个像素,根据用户设定的偏移量获取偏移后的坐标,然后将像素的值赋给即可实现图像的平移。2.2.2 图像的缩放图像缩放在图像的几何变换的实现过程中属于相对比较麻烦一点的。因为在放大和缩小的过程中所应用的原理不大相同。设图像在水平方向上的缩放比率为ZoomX,在垂直方向上的缩放比率是ZoomY,那么源图中点在新图中对应的点为: (2.16)针对放大比率与1的关系共有四种情况,本文只考虑两种比较特殊的情

27、况(在水平和垂直方向上同时放大或同事缩小的情况),下面针对这两种情况分别进行简要的讨论。1. 在两个方向上同时放大时,也就是和的情况。由于放大图像产生了新的像素,必须通过插值的方法来处理新增的像素。例如,同时放大两倍时,源图中的一个像素对应新图中的四个像素。2. 在两个方向上同时放大时,也即是和的情况。假如同时缩小0.5时,则新图中一个像素对应源图中的四个像素。这样在进行像素操作时,原则是每行中每相邻两个像素取一个,每隔一行取一行的方法。2.3 图像恢复图像平滑是图像恢复的一种方法,图像平滑主要是为了消除噪声。噪声并不限于人眼所能看的见得失真和变形,有些噪声只有在进行图像处理时才可以发现。图像

28、的常见噪声主要有加性噪声、乘性噪声和量化噪声等。图像中的噪声往往和信号交织在一起,尤其是乘性噪声,如果平滑处理不当,就会使图像本身的细节如边界轮廓、线条等变得模糊不清,如何既平滑掉噪声又尽量保持图像细节,是图像平滑主要研究的任务。由于一幅图像的大部分像素的灰度与临近像素的灰度差别不大,存在很大的灰度相关性,这就导致了图像的能量主要集中于低频区域,只有图像的细节部分的能量处于高频区域中,而图像噪声和假轮廓往往出现在高频区域中。这样就找到了去噪声的有效途径。图像平滑包括空域法和频域法两大类,在空域法中,图像平滑的常用方法是采用均值滤波或中值滤波,而在频域法中则设计各种频率滤波器进行低通滤波处理。1

29、. 图像平滑基本原理本文主要介绍时域平滑算法中最常用的3种方法即消噪声掩模法、邻域平均法、多图像平均法。1) 消噪声掩模法:可用于消除随机相加噪声该算法实际上市一种时域的低通滤波器的设计思想,其表达式为: (2.17)常用的(即低通滤波器的脉冲响应函数)主要有下面3中形式:这3种的作用域为,共有9个像素灰度参加运算,用此运算结果代替中心像素的像素灰度根据需要也可选用,等不同作用域的。的矩阵中心的元素值占得比例越小,平滑作用越强,所带来的副作用越大,即图像越模糊;的作用域越大,平滑作用越强,图像越模糊。用这种方法作平滑处理,图像四周围边缘的像素需特殊处理,以的情形为例处理如下:(1) 把源图像从

30、,所加大的两行和两列的像素灰度均取0,然后对加大后的像素平滑处理,结果只取,即舍去所加大的两行两列。(2) 不处理原始图像4个边缘的像素,处理后4个边缘的像素灰度保持原始,或人为地赋予特殊灰度。2) 邻域平均法:可消除麻点状噪声假设待处理图像为,处理后图像为,邻域平均法图像平滑处理的数学表达式了表示为: (2.18)为邻域内所包含的像素总数,为事先确定的邻域,该邻域不包括点。举例说明,如图2-3所示,半径为1的邻域表示为: (2.19)对应的;半径为的邻域表示为:(2.20)对应的。式(2.13)用卷积表示: (2.21)易见,对应半径为1的邻域,其可表示为,半径为的邻域,其可表示为。图 2-

31、3 不同半径的邻域以上算法简单,计算速度快,但缺点是使图像模糊。邻域取得越大,图像越模糊。可采用取阈值的邻域平均法。取阀值的邻域平均法的基本原理:一个窗口如窗口沿图像移动(逐行逐列),先求出窗口中除了待处理像元之外的全部像元灰度值的平均值。如果待处理像元灰度值与这个平均值之差的绝对值超过了某一预先确定的阈值,则该像元的灰度使用平均值代替;否则,保持该像元的灰度不变。3) 图像平均法:通过提高图像的信噪比,实现图像增强多图像平均法是以噪声干扰的统计学特征为基础的。如果一幅图像包含有噪声,可以假定这些噪声相对于每一坐标点是不是相关的,且其数学期望值为零。在实际图像采集中这种方法应用较多,但是图像的

32、后续处理中,由于很难得到多幅图像,因此实际应用受到限制,本文对此不再做探讨。由上述分析可知无论是采用消噪声掩模法还是邻域平均法,其算法的核心都是可归纳到模板矩阵的生成,它们之间的差别也就在于形式的差别。只要模板矩阵确定了,对于数据只要按照式(2.16)计算即可。下面介绍一种图像平滑的方法中值滤波。4) 中值滤波中值滤波是一种非线性信号处理方法,与其对应的中值滤波器当然也就是一种非线性滤波器。中值滤波器是在1971年由J.W. Jukey首先提出并用在一维信号处理技术中(时间序列分析),后来被二维图像信号处理技术所引用。它在一定条件下,可以克服线性滤波器如最小均方滤波、平均值滤波(平滑滤波)等所

33、带来的图像细节模糊,而且对滤除脉冲干扰及图像扫描噪声最为有效。在实际运算中并不需要图像的统计特性,这也带来了不少方便。但是对一些细节多,特别是多、线、尖顶细节的图像不宜采用中值滤波方法。由于中值滤波是一种非线性运算,对随机注入信号的严格数学分析比较复杂。下面主要采用直观的方法对确定性信号进行中值滤波作简要介绍。(1) 中值滤波基本原理中值滤波对数字图像进行处理可以直观地认为在图像画面中开一个一维的小窗口,它应该包含奇数个像素,按像素的灰度值从小到大排列起来,然后用中间灰度值来代替原排列的中间位置像素的灰度值。窗口然后在从左到右移动,直到边界。窗口下移一行,再从左到右依次进行。例:这样对图像灰度

34、的跳跃有平滑效果。 对一维信号,这样的中值滤波器有如下工作特性: 对一维阶跃信号、一维斜升信号无影响; 削平一维三角形信号的顶部峰信号; 滤掉脉冲信号当脉冲信号连续出现的个数少于窗口尺寸的一半,(如N=5,窗口尺寸的一半为2.5)。考虑到一般图像在两维方向上均具有相关性,因此,活动窗口一般选为两维窗口(如,等),窗口形状常用下列形状。二维中值滤波的窗口形状和尺寸对滤波效果影响较大,不同的图像内容和不同的应用要求,往往采用不同的窗口形状和尺寸。窗口尺寸一般先用3再取5,逐点增大,直到其滤波效果满意为止。对于包含有尖顶角物体的图像,适宜用十字形窗口,而窗口大小则以不超过图像中最小有效物体的尺寸为宜

35、。综上所述,中值滤波算法可以表示为: (2.22)其中,为窗口为图像像素灰度值序列。只要确定了窗口函数,图像中任一像素灰度便可由公式(2.22)求出。2.4 图像分割图像分割是一种重要的图像技术,在理论研究和实际应用中都得到了人们的广泛重视。图像分割的方法和种类有很多,有些分割运算可直接应用于任何图像,而另一些分割运算只能适用于分割特殊类别的图像。有些算法需要先对图像进行粗分割,因为它们需要从图像中提取出来的信息。例如,可以用对图像的灰度级设置门限的方法分割。需要指出的是,没有唯一的标准的分割方法。许多不同种类的图像或景物都可作为待分割的图像数据,不同类型的图像,已经有相对应的分割方法对其进行

36、分割,同时某些分割方法也只是适用于某些特殊类型的图像分割。分割结果的好坏需要根据具体的场合及要求衡量。图像分割是从图像处理到图像分析的关键步骤,可以说,图像分割结果的好坏直接影响对图像的理解。图像分割方法框架如图2-4:图2-4 图像分割方法框架图下面介绍一下边缘检测图像的边缘是图像的最基本特性。所谓边缘是指其周围像素灰度有跳跃变化的那些像素的集合。边缘广泛地存在于物体与背景之间、物体与物体之间、基元与基元之间。因此它是图像分割所依赖的重要特征。物体的边缘是以图像局部特性的不连续性的形式出现的,例如,灰度值的突变,颜色的突变,纹理结构的突变等。从本质上说,边缘常常意味着一个区域的终结和另一个区

37、域的开始。图像边缘信息在图像分析和人的视觉中都是十分重要的,是图像识别中提取图像特征的一个重要属性。1. 边缘检测的基本原理物体的边缘是由灰度的不连续性所反映的。经典的边缘提取方法是考察图像的每个像素的某个邻域内灰度的变化,利用边缘邻近的一阶或二阶导数变化规律,用简单的方法检测边缘,这种方法称为边缘检测局部算子法。此外还有基于曲面拟合的边缘检测方法,本文主要介绍一下算子法检测边缘。首先通过一个具体的例子说明算子法实现边缘检测的基本原理。假若有一幅图像,他的灰度分布如下: (2.23)不难发现源图中左边暗,右边亮,中间存在着一条明显的边界。给出一个边缘检测算子,进行模版运算后的结果如下。 (2.

38、24)可以看出,第4、5列比其他列的灰度值高很多,人眼观察时就能发现一条很明显的亮边,其他区域都很暗,这样就起到了边缘检测的作用。边缘检测中常用的算子有梯度算子、Sobel算子、Kirsh算子、拉普拉斯算子、Marr算子等。第3章 人耳人脸融合识别系统预处理模块的总体方案论证 3.1人耳人脸融合识别系统目前,采用人脸和其他特征体的融合已成为当前多模态识别的研究热点,但人脸同指纹、虹膜、手形等的融合,往往破坏了人脸识别所具有的非打扰特点。基于人耳人脸信息融合的多模态生物特征识别技术结合人脸和人耳识别自身的优点,扩大了非打扰识别的范围,并且能够充分利用人耳和人脸特殊的相对生理位置关系,获得更丰富的

39、识别信息,从而提高系统的性能。人耳人脸融合识别系统流程图如图3-1:图3-1 人耳人脸融合识别系统流程图人耳人脸融合识别系统由图像载入模块、图像预处理模块、特征融合模块、关联特征模块、最近邻分类器模块、识别模块。其中预处理模块对整个识别系统有非常重要的影响。因为图像预处理可以去除载入图像的干扰信息,增强图像中的可用信息,使最后的人耳人脸融合识别系统的识别正确率得到提高。本课题的主要内容是设计一个图像预处理模块,来提高人耳人脸融合识别系统的识别率。3.2 人耳人脸融合识别系统预处理模块的设计人耳人脸融合识别系统的特征识别方法分为几何特征识别和代数特征识别。几何特征识别需要标定人脸的特征点,即人脸

40、的五官的具体位置,然后在计算特征值(两眼之间的距离,两眼之间中点到嘴的距离等等);代数特征识别则需要标定出人脸的区域,然后在利用统计规律找出该人脸像素的整体分布特征,因为对于同一个人脸的不同幅图像,整体会呈现一定的规律。几何特征预处理方法的流程图如图3-2:图3-2 几何特征预处理方法流程图代数特征预处理方法的流程图如图3-3:图3-3 代数特征预处理方法流程图代数特征预处理同几何特征预处理相比有计算量小,受噪声和光照等干扰的影响较小的优势,所以本文在人脸图像预处理中采用基于代数特征对人脸进行预处理。在人耳图像预处理中,由于人耳检测比较复杂另外本次课题的时间限制,所以该模块采用已经手动检测好但

41、未经去噪、滤波等处理过的人耳图像,用图像增强对人耳图像进行预处理并且借助PCA的识别方法来进行特征提取和分类以及验证对人耳图像的预处理效果。3.2.1 人脸图像预处理模块设计人脸图像预处理方法采用的是基于代数特征的方法实现的。该模块中采用去噪声处理、肤色分割、二值化、水平直方图、垂直直方图的方法对人脸图像进行预处理,对人脸图像的分割采用的是基于肤色特征的图像分割处理。人脸图像预处理方法框图如图3-4:去噪声处理肤色分割二值化垂直直方图水平直方图标记人脸图3-4 基于代数特征人脸预处理方法框图下面阐述各种方法的作用:去噪声处理:图像经CCD摄像机等图像采集设备采集后会产生一系列噪声,这些噪声包括

42、幅值噪声、点位置噪声、感光片颗粒噪声,这将影响到后续的特征识别。该模块采用中值滤波的方法,对人脸图像进行去噪处理。从而提高图像可用信息的准确率。基于肤色的图像分割:针对彩色图像提出的一种基于肤色模型,采用基于色彩空间的肤色分割模型,初步筛选人脸的候选区域。通过在图像中进行是否是肤色的预先判断从而排除掉非肤色区域以减小搜索空间提高人脸检测算法的时间效率。该模块采用的肤色模型如下:1) 光线补偿处理考虑到肤色等色彩信息经常受到光源、颜色、图像采集设备的色彩的偏差等因素的影响,而在整体上偏离本质色彩向某一方向移动,即我们通常所说的色彩偏冷、偏暖、照片偏黄、偏蓝等等,这种现象在艺术照片中较为常见。 所

43、以Anil K.Jain等提出,为了抵消这种整个图像中存在的色彩偏差,我们将整个图像中所有像素的亮度(是经过了非线性Y一校正后的亮度)从高到低进行排列,取前5的像素,如果这些像素的数目足够多(例如,大于100),我们就将它们的亮度作为“参考白”(Reference White),也即将它们的色彩的R、G、B分量值都调整为最大的255。整幅图像的其他像素点的色彩值也都技这一调整尺度进行变换。2) 非线性分段色彩变换这是构成我们实际利用肤色模型的主要部分。这一非线性分段色彩变换得到的肤色模型属于色彩空间中的聚类模型,这一类肤色模型的建立首先要选取一种合适的色彩空间,我们注意到YCbCr色彩空间具有

44、如下优点:(1) YCbCr色彩格式具有人类视觉感知过程相类似的构成原理。(2) 色彩格式被广泛的应用在电视显示等领域中,也是许多视频压缩解码,如MPEG,JPEG等标准中普遍采用的颜色表示格式。(3) YCbCr色彩格式具有与HIS等其他一些颜色格式相类似的将色彩中的亮度分量分离出来的优点。(4) 相比HIS等其他一些色彩格式,YCbCr色彩格式的计算过程和空间坐标表示形式比较简单。(5) 实验结果表明在YCbCr色彩空间中肤色的聚类特性比较好。在YCbCr色彩空间中,肤色聚类是两头尖的纺锤形状,也就是在Y值较大和较小的部分,肤色聚类区域也随之缩减。由此可见,在Y值较大和较小的部分,肤色聚类

45、区域也随之缩减。由此可见,在Y值不同的地方,取Cb-Cr子平面的投影,得到的结果是不同的,由此得到结论,简单地排除Y分类,按照传统地做法在二维的Cb-Cr子平面中寻求肤色的聚类区域是不可行的,我们必须考虑Y值不同造成的影响,从而对YCbCr色彩格式进行非线性分段色彩变换。经过了非线性分段色彩变换得到的色彩空间我们用来表示。YCbCr坐标空间到坐标空间的变换过程推导如下:(1) 我们将肤色区域的中轴线分别用和的表达式为: (3.1) (3.2) 其中,和为常量,也就是非线性分段色彩变换的分段域值,分别为:125,188,和也是常量,他们由实验数据得到的肤色聚类区域中Y分量的最小的最大值。16,235。(2) 同样,我们将肤色区域的宽度分别用和来表示,这也是个分段函数,其表达式为: (3.3)其中i代表b或r,、和同(1)中的数据,Wc,WLc和WHc也是常数,它们分别为:WCb46.97 WLcb23 WHcb14WCr46.97 WLcr23 WHcr14(3) 最后,我们根据上面的结果得到如下的非线性分段色彩变换公式: (3.4)经过这样的非线性分段色彩变换,我

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 研究报告 > 信息产业


经营许可证编号:宁ICP备18001539号-1