毕业论文-基于神经网络的人脸识别【终稿】 .doc

上传人:韩长文 文档编号:3943223 上传时间:2019-10-10 格式:DOC 页数:30 大小:1.68MB
返回 下载 相关 举报
毕业论文-基于神经网络的人脸识别【终稿】 .doc_第1页
第1页 / 共30页
毕业论文-基于神经网络的人脸识别【终稿】 .doc_第2页
第2页 / 共30页
毕业论文-基于神经网络的人脸识别【终稿】 .doc_第3页
第3页 / 共30页
毕业论文-基于神经网络的人脸识别【终稿】 .doc_第4页
第4页 / 共30页
毕业论文-基于神经网络的人脸识别【终稿】 .doc_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《毕业论文-基于神经网络的人脸识别【终稿】 .doc》由会员分享,可在线阅读,更多相关《毕业论文-基于神经网络的人脸识别【终稿】 .doc(30页珍藏版)》请在三一文库上搜索。

1、基于神经网络的人脸识别摘要:人脸识别属于一种刚刚兴起的生物特征识别技术,生物特征鉴别是通过人体自身特征进行身份识别认证的一种技术,具有很过优点,例如唯一性,不以伪造,不可窃取,安全可靠等。在众多生物特征的识别技术当中,人脸识别更为直接友好,方便,且更易接受,它具有非侵犯性,主动性等非常多的优点,是一种较为理想的验证身份的手段。因其具有这些特点,使它成为了计算机模式识别,人工智能识别的宠儿。在21世纪这样科技高速发展的时代,安全问题问题不容忽视,这也为人脸自动识别开辟了一个应用的前景。为了提高人脸识别系统的准确性,人们提出了许多方法来进行识别。本文先采用图像预处理得到统一化的灰度图像后,进行主成

2、分分析,然后采用的事BP神经网络通过进行训练对人脸进行识别,达到身份证件照识别的效果。关键词:人脸识别 图像预处理 主成分分析 BP神经网络 Summary:Face recognition is a kind of newly emerging biometric technologies, biometric identification is characterized by the bodys own identification to authenticate a technology with a very had advantages such as uniqueness, no

3、t to counterfeit, do not steal, safe and reliable . Among the many biometric identification technology which, face more direct and friendly, convenient, and more acceptable, it has a lot of advantages of non-invasive, initiative, etc., it is an ideal means to verify the identity. Because it has thes

4、e characteristics, it has become a computer pattern recognition, artificial intelligence to identify darling. In the era of the 21st century, this rapid development of technology, security issues can not be ignored, it also automatically recognize human faces the prospect of an open application. In

5、order to improve the accuracy of face recognition system, a number of methods have been proposed to be identified. After the article first obtained by image preprocessing unified grayscale image, principal component analysis, then use something BP neural network trained by the human face recognition

6、, to the identity of passport recognition.Keywords: Face Recognition Image preprocessing Principal component analysis BP neural network目录1绪论1.1 人脸识别研究的背景与意义1.2 人脸识别的国内外研究现状1.3 人脸识别的研究内容2 图像预处理2.1 RGB转化为256级灰度2.2图像增强一 绪论1.1 人脸识别研究的背景与意义随着社会的进步与技术的发展,个人信息已经越来越重要了。与之同时,个人信息的识别也变得同样重要。如何快速有效,简单方便的进行身份识别

7、已经成为关系到切身利益的问题。个人的识别已经不仅仅局限于姓名,身份证号等文字识别上,生物特征识别技术在近几十年得到了快速发展。人类有许多自身的特征与生俱来,不会丢失,遗忘,转让,防伪性好,便于携带并且具有唯一性等多项优点。它同指纹识别、虹膜识别、视网膜识别、声音识别、笔记识别相似,属于六大生物识别技术识别1.。现在比较常见的识别技术有虹膜识别,指纹识别,静脉识别,人脸识别等。众多生物特征的识别技术当中,人脸识别占了很大的比重,得到更多的研究与应用,原因在于人脸识别具有以下特点。1. 具有直接,方便,无侵犯性的优点。并且获取人脸图像时可以不接触接受检测者,易于被用户接受。2. 具有成本低的优点。

8、人脸识别的过程只需要一个摄像头,摄像机或手机也可以。对用户没有特别要求,采集一般可在数秒内完成。3. 具有无人工参与的优点。整个识别过程全部都是由计算机自动完成,效率得到了极大的提升。 4.与人类的习惯一致。 近年来,由于人脸识别具有许许多多的优点,越来越多的研究人员关注到了人脸识别,它也拥有更好的发展前景。在人脸识别是我们视觉系统最基本也是最重要的功能之一。人们通过人脸的差异性来识别彼此的身份。因此,通过计算机对人脸进行自动识别成为了计算机视觉领域中的重要课题。近几十年,由于计算机技术的发展及大规模集成电路技术的高速发展,离散数学理论与人工神经网络的创建与完善,自动人脸识别的研究和应用得到了

9、极大的重视,并取得持久的进步。自动识别人脸的研究有着极大的价值。在学术研究领域上,它同模式识别,计算机视觉,生理学心理学及人工智能等方面的交叉可以促进发展。它的另一重要的价值在于它的实际应用。人脸识别最初的应用源于公安部门对犯罪分子的刑侦破案及档案管理。目前人脸识别技术已经广泛的应用于政府、军队、银行、社会福利保障、电子商务、安全防务等领域。例如,美国“9.11”事件后,各个国家政府已然对反恐怖活动达成了的共识,加强机场的安全防务十分重要。美国维萨格公司的脸像识别技术在美国的两家机场大显神通,它能在拥挤的人群中挑出某一张面孔,判断他是不是通缉犯。随着技术的进一步成熟和社会认同度的提高,人脸识别

10、技术将应用在更多的领域。1、企业、住宅安全和管理。如人脸识别门禁考勤系统,人脸识别防盗门等。甚至可能出现在家庭电器设备一体化2。2、电子护照及身份证。在许多场合对于个人身份的检验是一种十分常用而又必要的手段。也许这是未来最大规模的应用,国际民航组织(ICAO)已确定,从2010年起,其118个成员国家和地区,必须使用机读护照,人脸识别技术是首推识别模式,该规定已经成为国际标准。中国的电子护照计划公安部一所正在加紧规划和实施。对于识别身份证,驾驶证等上的照片这项工作则可以交由机器完成,高效又准确。3、公安、司法和刑侦。如利用人脸识别系统和网络,在全国范围内搜捕逃犯。也可以根据目击证人的描述画出犯

11、罪嫌疑人的肖像,经过计算机合成人脸,对犯罪嫌疑人进行有效抓捕。4、自助服务。如银行的自动提款机,如果用户卡片和密码被盗,就会被他人冒取现金。如果同时应用人脸识别就会避免这种情况的发生。5、信息安全。由于科技的进步,犯罪分子伪造的技术也是层出不穷。如计算机登录、电子政务和电子商务的安全问题成为了我们考虑的重中之重。在电子商务中交易全部在网上完成,电子政务中的很多审批流程也都搬到了网上。而当前,交易或者审批的授权都是靠密码来实现,如果密码被盗,就无法保证安全。但是使用生物特征,就可以做到当事人在网上的数字身份和真实身份统一,从而大大增加电子商务和电子政务系统的可靠性。人脸检测的应用背景已经远远超出

12、了人脸识别系统的范畴,在基于内容的检索、数字视频处理、视觉监测等方面有着重要的应用价值。根据以上的应用可以看出,人脸识别技术的研究对社会是有极大贡献的,甚至可以产生对人类生活更为深远的影响。虽然到目前为止现在的市场上已经有了形形色色的人脸识别系统的产品,关于人脸识别的研究也取得了一定的成果。但是由于人脸识别的复杂性,以及人脸本身存在这情绪,表情,光照,角度,是否化妆等影响,甚至带饰品与否都能够对识别的准确性,效果及稳定性产生影响。识别中常见的难题中主要包括的见下表3:为了更好的识别出人脸,找到解决这些问题的方法,成功构造出人脸检测与跟踪系统,将为解决其它类似的复杂模式检测问题提供重要的启示。表

13、1.1 人脸识别过程中遇到的常见的问题姿态变化人脸的倾斜,人脸朝向人脸表情喜 怒 哀 乐 甚至心情也会对面部图像产生影响年龄跨度年龄的增长伴随的皱纹等成像条件光照强度 摄像距离 拍摄方向及角度装饰眼镜 帽子或者项链的佩戴与否遮挡图像采集过程中外部物体产生遮挡1.2人脸识别国内外的研究现状人脸是我们进行感情的表达和交流,同时也可以传递信息。我们可以通过人的面部来判断一个人的性别,年龄,种族。你可以通过一个人面部细微的变化来感知他的情绪,状态,性格。人脸识别就是判断输入的图像是否存在人脸,如果存在,就进一步的根据人脸的位置,特征等信息来提取人脸主人的身份。人脸识别是一个既古老又年轻的课题,说它古老

14、是因为早在上个世纪,法国Galton已经进行了研究。追溯到20世纪50年代,而当时的人们主要把它应用到社会心理学的领域。七十年代中期以前,有少量文献发表。直到20世纪70年代,从Kanade和Kelly开始,才算的上对于人脸识别真正的研究。当时主要运用的是典型的模式识别。典型的模式识别都是通过利用脸部重要特征点之间的距离来实现的,并且侧重于提取人脸侧面图像的特征。最早的研究见于文献【4】,Blodsoe以人脸特征点的距离,比例等作为参数,建成的半自动人脸识别。这个阶段对图像的约束条件较多,特征数目少,提取的特征不够准确。随着计算机技术的发展,约在80年代到90年代初期,人脸识别技术得到了极大的

15、发展,并且能够逐步的把理论应用到实际中。在此期间,人脸识别的方法开始出现了多样化。Eigenfaces和Fisherfaces在大量的数据库中进行的实验取得了较为满意的效果。但是依然存在着光线,角度影响准确度的问题,人脸定位不够敏感。国内关于人脸自动识别的研究始于二十世纪80年代,有了许多科研场所的理论,见表1.2.另外还有其它科研场所如:中科院计算所,中科院自动化所,复旦大学等,并都取得了一定的成果.国内的研究工作主要是集中在三大类方法的研究:基于几何特征的人脸正面自动识别方法、基于代数特征的人脸正面自动识别方法和基于连接机制的人脸正面自动识别方法。表1.2 人脸识别研究研究机构研究人员研究

16、方向清华大学边肇祈KL变换清华大学彭辉 张长水特征脸方法,提出利用类间散布矩阵作为产生矩阵,进一步降低了产生矩阵的维数,在保持识别率的情况下,大大降低了运算量。上海交通大学李介谷计算机视觉场模型东南大学程永清基于统计方法,主要是奇异值分解方法四川大学周激流具有反馈机制的人脸正面识别系统,运用积分投影法提取面部特征的关键点并用于识别,同时也尝试了“稳定视点”特征提取方法,即为使识别系统中包含3D信息,他对人脸侧面剪影识别做了一定的研究,并实现了正,侧面互相参照的识别系统。中国科技大学杨光正基于镶嵌图的识别方法,采用基于知识的三级金字塔结构对人脸进行基本定位,前两级建立在不同分辨率的镶嵌图基础上,

17、第三级用一种改进的边缘检测方法进一步检测眼睛和嘴巴。南京理工大学杨静宇奇异值分解方法北京科技大学王志良人工心理,建立了以数学公式为基础的心理学模型。中科院计算所与成都银晨网讯与2000年5月联合创立了国内首家专门从事面像识别核心技术研究与开发的实验室。主要研究领域涉及计算机视觉、模式识别、机器学习等,尤其关注于人脸识别以及多模式人机交互技术。他们关注的核心技术主要包括:实时精确的人脸检测与跟踪,快速精确的面部特征定位,准确快速的人脸识别/确认方法等。尤其关注复杂环境下(光照、姿态、表情、老化等)的人脸识别问题。根据美国生物识别文摘报道,生物识别产品的销售约为0.6亿美元,第二年增长到1.1亿美

18、元。中国人脸识别产品的市场占有量份额十分小。然而,近年开始,中国的人脸识别市场以极快的的速度蓬勃的发展。如此迅猛的发展主要有以下几个原因:1. 科技界以及社会各个层面对人脸识别的认知加深,全面的接受普及,国家政府高度重视,大力支持。2. 需求的不断增加。除了传统的门禁,考勤外,安全问题也同样重要。如果可以在监控视频中识别出人的身份,能够极大的保护人民的人身以及财产的安全。3. 人口基数因素。人脸识别的市场与人口数量是成正比的,这也从根本上决定了我国的高需求。在全世界范围内,当前很多国家展开了有关人脸识别的研究,欧美和日本也已经研究出较为先进的人脸识别技术,提出了许多稳定可靠的方案。全球著名的研

19、究机构有美国 MIT 的 Media lab,AI lab,CMU 的 Human-ComputerInterface Institute,Microsoft Research,英国的Department of Engineering in University of Cambridge等。美国国家标准技术局举办的Face Recognition Test 2006通过大量的人脸数据监测表明,当前世界上人脸识别的精度已经超过人类的平均水平。对于高清晰度的人脸识别,机器识别的准确率几乎为百分之百。 20世纪90年代以来,随着高速高性能计算机的出现,人脸识别方法有了重 大突破,进入了真正的机器自动

20、识别阶段。国外许多大学在人脸识别方面取得了巨大进展,他们研究涉及的领域广泛,其中有从感知和心理学角度探索人类识别人脸机理的,如美国Texas at Dallas大学的Abdi和Toole小组,主要研究人类感知人脸的规律;由Stirling大学的Bruce教授和Glasgow大学的Burton教授合作领导的小组,主要是研究在人类大脑在人脸认知中的作用,并在此基础上建立了人脸认知的两大功能模型,他们对熟悉和陌生人脸的识别规律以及图像序列的人脸识别规律也进行了研究;也有从视觉机理角度进行研究的,英国Aberdeen大学的Craw小组,主要研究人脸视觉表征方法,他们对空间频率在人脸识别中的作用也进行了

21、分析;荷兰Groningen大学的Petkov小组,主要研究人类视觉系统的神经生理学机理并在此基础上发展了并行模式识别方法。更多的学者则从事利用输入图像进行计算机人脸识别的研究工作。 经过市场长期的检验,这些方案已经属于领先的水平,但是由于人脸的复杂性,使人脸识别的研究有待进一步的提升,依旧处于发展阶段【5】。1.3人脸识别的研究内容人脸识别主要分为人脸检测,人脸处理与人脸识别三部分。人脸检测:人脸检测就是实现人脸自动提取采集,从摄像机视野或图片内的复杂背景图像中自动提取检测提供的图像是否存在人脸,如果存在进行人脸的预处理。确认检测目标的人脸属性。人脸处理:为了能够在大量的数据中高速并准确的寻

22、找到有用的信息,往往需要对图像提供的信息进行处理,即不改变原有质量的情况下降低输入数据。人脸处理就是对图像进行降维处理。人脸识别就是将进行过处理后准备识别的图像进行对比,通过阈值来判别是否是同一张人脸。如果大于阈值,则是同一人,如果小于阈值就认为不是同一人。常用的人脸识别的方法有多种。见表1.3表1.3 人脸识别常见方法及特点人脸识别方法方法特点几何特征几何特征是利用眼、鼻、嘴等的形状和它们之间的几何关系(如相互之间的距离)。这种算法识别迅速,占用的内存小,但识别的准确率较低。特征脸(PCA)特征脸方法是基于KL变换的人脸识别方法,KL变换是图像压缩的一种最优正交变换。高维的图像空间经过KL变

23、换后得到一组新的正交基,保留其中重要的正交基,由这些基可以张成低维线性空间。如果假设人脸在这些低维线性空间的投影具有可分性,就可以将这些投影用作识别的特征矢量,这就是特征脸方法的基本思想。这些方法需要较多的训练样本,而且完全是基于图像灰度的统计特性的。目前有一些改进型的特征脸方法。神经网络神经网络的输入可以是降低分辨率的人脸图像、局部区域的自相关函数、局部纹理的二阶矩等。这类方法同样需要较多的样本进行训练,而在许多应用中,样本数量是很有限的。弹性图匹配弹性图匹配法在二维的空间中定义了一种对于通常的人脸变形具有一定的不变性的距离,并采用属性拓扑图来代表人脸,拓扑图的任一顶点均包含一特征向量,用来

24、记录人脸在该顶点位置附近的信息。该方法结合了灰度特性和几何因素,在比对时可以允许图像存在弹性形变,在克服表情变化对识别的影响方面收到了较好的效果,同时对于单个人也不再需要多个样本进行训练。线段Hausdorff 距离(LHD)LHD是基于从人脸灰度图像中提取出来的线段图的,它定义的是两个线段集之间的距离,与众不同的是,LHD并不建立不同线段集之间线段的一一对应关系,因此它更能适应线段图之间的微小变化。实验结果表明,LHD在不同光照条件下和不同姿态情况下都有非常出色的表现,但是它在大表情的情况下识别效果不好。支持向量机(SVM)支持向量机主要解决的是一个2分类问题,它的基本思想是试图把一个低维的

25、线性不可分的问题转化成一个高维的线性可分的问题。通常的实验结果表明SVM有较好的识别率,但是它需要大量的训练样本(每类300个),这在实际应用中往往是不现实的。而且支持向量机训练时间长,方法实现复杂,该函数的取法没有统一的理论。示例学习示例学习的基本思想是从某一概念的已给正例和反例的集合中归纳产生出接受所有正例同时排斥所有反例的该概念的一般规则.将人脸样本和非人脸样本送入学习机中,产生出判别规则,从而用于作为判断输入的测试图像是否属于人脸的主要判别依据.隐马尔可夫模型马尔可夫模型是一个离散时序有限状态自动机,隐马尔可夫模型(HMM)是指这一马尔可夫模型的内部状态外界不可见,外界只能看到各个时刻

26、的输出值.图1.1人脸识别流程图二 图像预处理图像预处理的过程是将每一个文字图像分别检测出来交给识别模块识别。是在图像分析过程中,对输入的图像进行特征的抽取、分割和匹配之前所进行的处理。图像预处理最主要目的在于消除图像之中无用的信息,恢复必要的真实信息,增加相关信息的可检测性以及最大程度地化减数据,进而增强特征的抽取、图像的分割、匹配以及识别的可靠性。预处理过程大体有数字化、几何变换、归一化、平滑、复原和增强等几个步骤。一幅原始照片灰度的数字化是空间变量(位置的连续值)的连续函数。在点阵上对图像灰度进行采样并加以量化(归为2个灰度等级之一),能够得到计算机可以处理的数字图像。为了让数字图像可以

27、重建本来的图像,对、和值的大小就有规定的限制。在接收装置的空间以及灰度分辨能力范围之内,、和的值越大,图像重建的效果的质量就越好。每当取样的周期等于或者小于原始图像内最小细节周期的二分之一时,重建图像的频谱与原始图像的频谱相等,因而重建图像与原始图像能够完全一致。由于、和三者的相乘的结果决定了一幅图像在计算机中的存储量,因此在存储量固定的条件下需要根据图像的有差异的性质来选择适合的、和值,以达到最佳的处理效果。几何变换应用在修正图像采集系统的系统误差以及仪器位置的不固定误差所进行的交换。预处理是人脸识别过程中一个重要环节,其主要目的是 消除图像中的冗余信息,滤除干扰、噪声,增强有关信息的 可检

28、测性,从而提高识别的可靠性。在预处理阶段,对图像 进行优化,尽可能去除或者减小外部环境对预处理图像的干扰,为后续处理提高质量。2.1 RGB转化为256级灰度彩色图像包含了人脸的许多特征,但处理起来非常复杂。而灰度图像在保存基本特征的基础上减少了信息的总量,便于计算.RGB图像就是彩色*3的数组,RGB即是代表红、绿、蓝三个通道的颜色,也就是图像的三原色,这个标准几乎包括了人类视力所能感知的所有颜色,是目前运用最广的颜色系统之一。在图像处理中有256级颜色等级,由8bit表示。RGB是三维直角坐标颜色系统中的一体。如图所示,图RGB色彩空间图RGB颜色空间虽然可以完整的描述颜色信息,但信息量却

29、极为庞大,减低了系统运行的速度,所以在处理图像时,通常把RGB图像转换为8bit的灰度图像或1bit的黑白图像,也就是图像的灰度化和二值化【16】,这样及保存了图像的基本特征信息,又降低了信息的储存量。图像的灰度化转换关系式为:图 原图像 图 转换后的灰度图像2.2图像增强图像增强是一种计算机的术语,它是将原本不清晰的图像变得清晰或者令某些感兴趣的特征变得明显,亦或是减少不感兴趣的特征,使图像质量增强、丰富信息量,加强图像判别读取和识别效果的图像处理方法。例如,消除照片中的划痕,改善光照不均匀的图像,突出目标的边缘等。从处理的作用域出发,图像增强大体可分为两大类:频率域法和空间域法。频率域法是

30、把图像看作一种二维信号,并对其进行基于二维傅里叶变换的信号增强。采用低通滤波(即只允许低频信号通过)法,能够去除图中的噪声;若采用高通滤波法,则可以增强边缘等高频信号,令模糊的图片变得清楚。空间域法中具有的代表性的算法有局部求平均值法和中值滤波(取局部邻域中的中间像素值)法等,它们能够用来去除或减弱噪声。也就是直接对像素进行处理。基于空域的算法处理时直接对图像灰度级做运算,基于频域的算法是在图像的某种变换域内对图像的变换系数值进行某种修正,是一种间接增强的算法。基于空域的算法分为点运算算法和邻域去噪算法。点运算算法即灰度级校正、灰度变换和直方图修正等,目的或使图像成像均匀,或扩大图像动态范围,

31、扩展对比度。邻域增强算法分为图像平滑和锐化两种。平滑一般用于消除图像噪声,但是也容易引起边缘的模糊。常用算法有均值滤波、中值滤波。锐化的目的在于突出物体的边缘轮廓,便于目标识别。常用算法有梯度法、算子、高通滤波、掩模匹配法、统计差值法等。图像对比度增强的方法可以分成两类:1. 直接对比度增强方法;2. 间接对比度增强方法。间接对比度增强最常见的两种方法是直方图拉伸和直方图均衡化。为了达到增强对比度的目的,直方图拉伸是利用对比度拉伸对直方图进行调整,进而“扩大”前景和背景灰度的差别,这种方法可以利用线性或者非线性的方法来实现;直方图均衡化是通过使用累积函数对灰度值进行“调整”来完成对比度的增强。

32、2.3直方图均衡化直方图均衡化又称直方图平坦化,它是图像的最基本统计特征,是针对已知灰度概率密度分布图像经过变换后具有均匀灰度概率分布的直方图。它反映了图像灰度值的分布情况,图像的明暗分布规律,扩展了像元取值的动态范围以实现增强图像整体对比度的目的。直方图均衡化是图像处理领域中利用图像直方图对对比度进行调整的方法。直方图是一种点操作,常用来增加许多图像的局部对比度,特别是当图像的有意义数据的对比度十分接近的时候,它逐点改变图像的灰度值。在每个灰度级上都具有相同的象素点数的过程,为了使图像在整个灰度值动态变化范围内分布均匀化,使直方图趋于平衡,改善图像的亮度分布状态。这样可以用于增强局部的对比度

33、而不影响整体,通过有效地扩展常用的亮度来实现这种功能。通过图像变换进行直方图调整,获得较好的视觉效果,增强图像的视觉效果。直方图均衡化算法分为三步第一步是对给定的待处理图像统计直方图每个灰度级出现的次数,求出第二步是累计归一化的直方图,根据得出的直方图采用累积分布函数做变换,求出新的灰度第三步是用新灰度值取代旧的灰度值,计算新的像素值求出,同时把灰度值相等或近似的合并由图2.8对比可以得出,原图像灰度值集中对比效果较差,经过处理过后的图像直方图方位扩大,分布稀疏部分压缩,密集部分拉伸,突出细节,使对比增强,达到预期效果。直方图均衡化的有点是对于背景和前景都太亮或者太暗的图像非常有用,能自动增强

34、整个图像的对比度,它是一种灵活并且是一种常见的直方图修正技术。这种方法的一个主要优势是它是一个相当直观的技术并且是可逆操作,如果已知均衡化函数,那么就可以恢复原始的直方图,并且计算量也不大。在实际中为了使直方图成为某个特定的图形,需要对其进行变换处理。这样才能有选择性的增强或者让图像的灰度值在某贵低昂的范围内。这种方法的一个缺点是它对处理的数据不加选择,具体增强效果不易控制,它可能会增加背景杂讯的对比度并且降低有用信号的对比度;变换后图像的灰度级减少,某些细节消失,处理的结果总是得到全局均衡化的直方图;某些图像,如直方图有高峰,经处理后对比度不自然的过分增强。图2.82.4灰度拉伸图像灰度拉伸

35、又叫对比度拉伸,它是最基本的一种灰度变换,是运用简单的分段线性变换函数进行灰度变化的一种方法。该方法将原图像亮度值动态范围按线性关系扩展到指定的范围或整个动态范围,提高了图像在处理过程中灰度级的动态变化,适用于低对比度图像的处理。灰度拉伸的两个基本操作 直方图统计,对给定的待处理图像做直方图统计,来确定对图像进行灰度拉伸的两个拐点; 灰度变换,利用步骤确定的拐点,分段线性变换函数进行像素灰度值的映射。 该方法可以增强图像对比度,突出细节。图4.2原始图像以及灰度拉伸处理后的效果2.5 图像的去噪实际图像都会受到某些干扰而存在噪声,如果直接进行提取会存在很大的误差,因此,提高识别率的重要途径就是

36、对图像进行去噪处理。平滑技术是平滑消除图像中随机噪声的技术。在消除噪声的同时不让图像轮廓或者线条变得模糊不清是对平滑技术的基本要求。最常用的平滑方法有中值法、近邻平均法和局部求平均法。局部区域大小既能够固定的,也能够是逐点随灰度值大小变化而变化的。2.5.1中值滤波中值滤波是一种基于排序理论中的一种非线性处理技术,是抑制图像噪声的主要方法之一。它是基于图像的这样一种特性:图像像素较多,面积较大的小块构成,噪声通常以对应的像素数较少的孤立点的形式存在。它同时对干扰脉冲有良好的抑制作用并可以在一定程度上克服线性滤波所带来的图像细节模糊,而且它对图像扫描噪声非常有效。 它是图像预处理很好的方法。 中

37、值滤波采用像素插值的方法,在一维的情况下,中值滤波器是一个含有奇数个像素的采样窗口,进行排序。在处理之后,位于窗口正中的像素的灰度值,用窗口内各像素灰度值的中值代替。例如若窗口长度为5,窗口中像素的灰度值为70、60、220、120、150,则中值为120,原来窗口正中的灰度值是220,现在变成了120。若220是噪声的尖峰,则会被滤除。但是,若它是一个信号,则滤波之后会被消除,降低了分辨率。因此中值滤波方法能出去大的噪声点,但是将噪声点带入非噪声区进行计算会损失图像质量。中值滤波的步骤: (1) 将待处理在图中漫游在模板中,使模板中心与图中某个像素位置重合; (2) 当模板处于某一位时,读取

38、模板下各对应像素的灰度值; (3) 将灰度值从小到大排成一列; (4) 找出灰度值的中间值; (5)将这个中间值赋给对应模板中心位置的像素。中值滤波的优点:灰度图像都是存在对图像质量产生极大影响的噪声。中值滤波能让与周围像素灰度值的差比较大的像素改取与周围像素值接近的值,它不是简单的取均值,所以产生的模糊比较少,在出去噪声点的同时不会使图像变得模糊,能够保持图像的分布特性,能滤去图像中的高频或低频。中值滤波器先被应用于一维信号的处理中,后被引用到二维图像的处理中来。二维中值滤波输出数学表达式为,其中,分别为原始图像以及处理后图像,W为二维模板。2.5.2 低通滤波从频谱上看,噪声是一种高频信号

39、。低通滤波是一种过滤方式,可以简单的认为:设定一个频率点,当信号频率高于这个频率时不能通过,在数字信号中,这个频率点也就是截止频率,当频域高于这个截止频率时,则全部赋值为0。因为在这一处理过程中,让低频信号全部通过,所以称为低通滤波。一般令图像经过一个二维低通的数字滤波器,使高频信号衰减。低通滤波采用图像领域灰度梯度的方法,过滤梯度变化大的图像点,因为噪声的区域面积较小,变化较多,低通滤波可以是把过滤掉的像素点填充到其附近的位置,因此,低通滤波不仅可以过滤噪音,更能很好的保护非噪声区域的图像信息。理想低通滤波器的传递函数:其中,为指定的阈值,为滤波器的输入值,为滤波器的输出值。即滤波器输入值大

40、于阈值,输出1,小于阈值,输出0.在空间域上进行滤波就是图像和滤波器的冲击响应函数进行卷积。滤波冲击响应函数的卷积表达式为:其中为图像图2-4 平滑滤波效果a)加入噪声的图像 b)滤波后的图像图2-5 锐化滤波效果图a) 原灰度图像 b)锐化后的图像边缘检测边缘检测的定义边缘检测是图像处理和计算机视觉中的基本问题,边缘检测的目的是标识数字图像中亮度变化明显的点,它大幅度地减少了数据量并去除了认为不相关的信息,保留了图像重要的结构属性。图像属性中的显著变化通常反映了属性的重要事件和变化。 这些包括(i)深度上的不连续、(ii)表面方向不连续、(iii)物质属性变化和(iv)场景照明变化。 简介图

41、像边缘检测,有许多方法用于边缘检测,它们的绝大部分可以划分为两类:基于查找一类和基于零穿越的一类。基于查找的方法通过寻找图像一阶导数中的最大和最小值来检测边界,通常是将边界定位在梯度最大的方向。基于零穿越的方法通过寻找图像二阶导数零穿越来寻找边界,通常是Laplacian过零点或者非线性差分表示的过零点。属性边缘可能与视角有关- 也就是说边缘可能随着视角不同而变化,典型地反映在场景、物体的几何形状一个将另一个遮挡起来,也可能与视角无关-这通常反映被观察物体的属性如表面纹理和表面形状。在二维乃至更高维空间中,需要考虑透视投影的影响。一个典型的边界可能是,例如一块红色和一块黄色之间的边界,与此相反

42、的是边线可能是在另外一种不变的背景上的少数不同颜色的点。在边线的每一边都有一个边缘。在许多图像处理的应用中边缘都起着非常重要的作用。然而,在最近几年,不明显依赖于边缘检测作为预处理的计算机视觉处理方法研究取得了一些实质性的研究成果。检测边缘如果将边缘认为是一定数量点亮度发生变化的地方,那么边缘检测大体上就是计算这个亮度变化的导数。为简化起见,我们可以先在一维空间分析边缘检测。在这个例子中,我们的数据是一行不同点亮度的数据。例如,在下面的1维数据中我们可以直观地说在第4与第5个点之间有一个边界:除非场景中的物体非常简单并且照明条件得到了很好的控制,否则确定一个用来判断两个相邻点之间有多大的亮度变

43、化才算是有边界的阈值,并不是一件容易的事。实际上,这也是为什么边缘检测不是一个微不足道问题的原因之一。检测方法有许多用于边缘检测的方法, 他们大致可分为两类:基于搜索和基于零交叉。基于搜索的边缘检测方法首先计算边缘强度, 通常用一阶导数表示, 例如梯度模,然后,用计算估计边缘的局部方向, 通常采用梯度的方向,并利用此方向找到局部梯度模的最大值。基于零交叉的方法找到由图像得到的二阶导数的零交叉点来定位边缘。 通常用拉普拉斯算子或非线性微分方程的零交叉点。滤波做为边缘检测的预处理通常是必要的,通常采用高斯滤波。已发表的边缘检测方法应用计算边界强度的度量,这与平滑滤波有本质的不同。 正如许多边缘检测

44、方法依赖于图像梯度的计算,他们用不同种类的滤波器来估计x-方向和y-方向的梯度。计算一阶导数许多边缘检测操作都是基于亮度的一阶导数-这样就得到了原始数据亮度的梯度。使用这个信息我们能够在图像的亮度梯度中搜寻峰值。如果 I(x) 表示点 x 的亮度,I(x) 表示点 x 的一阶导数(亮度梯度),这样我们就会发现:对于更高性能的图像处理来说,一阶导数能够通过带有掩码的原始数据(1维)卷积计算得到。计算二阶导数其它一些边缘检测操作是基于亮度的二阶导数。这实质上是亮度梯度的变化率。在理想的连续变化情况下,在二阶导数中检测过零点将得到梯度中的局部最大值。另一方面,二阶导数中的峰值检测是边线检测,只要图像

45、操作使用一个合适的尺度表示。如上所述,边线是双重边缘,这样我们就可以在边线的一边看到一个亮度梯度,而在另一边看到相反的梯度。这样如果图像中有边线出现的话我们就能在亮度梯度上看到非常大的变化。为了找到这些边线,我们可以在图像亮度的二阶导数中寻找过零点。如果 I(x) 表示点 x 的亮度,I(x) 表示点 x 亮度的二阶导数,那么:同样许多算法也使用卷积掩码快速处理图像数据:步骤:滤波:边缘检测算法主要是基于图像强度的一阶和二阶导数,但导数的计算对噪声很敏感,因此必须使用滤波器来改善与噪声有关的边缘检测器的性能。需要指出,大多数滤波器在降低噪声的同时也导致了边缘强度的损失,因此,增强边缘和降低噪声

46、之间需要折中。增强:增强边缘的基础是确定图像各点邻域强度的变化值。增强算法可以将邻域(或局部)强度值有显著变化的点突显出来。边缘增强一般是通过计算梯度幅值来完成的。检测:在图像中有许多点的梯度幅值比较大,而这些点在特定的应用领域中并不都是边缘,所以应该用某种方法来确定哪些点是边缘点。最简单的边缘检测判据是梯度幅值阈值判据。定位:如果某一应用场合要求确定边缘位置,则边缘的位置可在子像素分辨率上来估计,边缘的方位也可以被估计出来。在边缘检测算法中,前三个步骤用得十分普遍。这是因为大多数场合下,仅仅需要边缘检测器指出边缘出现在图像某一像素点的附近,而没有必要指出边缘的精确位置或方向。边缘检测的实质是

47、采用某种算法来提取出图像中对象与背景间的交界线。我们将边缘定义为图像中灰度发生急剧变化的区域边界。图像灰度的变化情况可以用图像灰度分布的梯度来反映,因此我们可以用局部图像微分技术来获得边缘检测算子。经典的边缘检测方法,是通过对原始图像中像素的某小邻域构造边缘检测算子来达到检测边缘这一目的的。阈值确定一旦我们计算出导数之后,下一步要做的就是给出一个阈值来确定哪里是边缘位置。阈值越低,能够检测出的边线越多,结果也就越容易受到图片噪声的影响,并且越容易从图像中挑出不相关的特性。与此相反,一个高的阈值将会遗失细的或者短的线段。一个常用的这种方法是带有滞后作用的阈值选择。这个方法使用不同的阈值去寻找边缘。首先使用一个阈值上限去寻找边线开始的地方。一旦找到了一个开始点,我们在图像上逐点跟踪边缘路径,当大于门槛下限时一直纪录边缘位置,直到数值小于下限之后才停止纪录。这种方法假设边缘是连续的界线,并且我们能够跟踪前面所看到的边缘的模糊部分,而不会将图像中的噪声点标记为边缘。边缘检测算子算子阶数算子类型一阶Roberts Cross算子,Prewitt算子,Sobel算子, Kirsch算子,罗盘算子二阶Marr-Hildreth,在梯度方向的二阶导数过零点,Canny算子,Laplacian算子Canny算子(或者这个算子的变体)是最常

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1