一种基于神经网络和贝叶斯决策的人脸检测方法.doc

上传人:吴起龙 文档编号:1592062 上传时间:2018-12-26 格式:DOC 页数:9 大小:18.77KB
返回 下载 相关 举报
一种基于神经网络和贝叶斯决策的人脸检测方法.doc_第1页
第1页 / 共9页
一种基于神经网络和贝叶斯决策的人脸检测方法.doc_第2页
第2页 / 共9页
一种基于神经网络和贝叶斯决策的人脸检测方法.doc_第3页
第3页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《一种基于神经网络和贝叶斯决策的人脸检测方法.doc》由会员分享,可在线阅读,更多相关《一种基于神经网络和贝叶斯决策的人脸检测方法.doc(9页珍藏版)》请在三一文库上搜索。

1、一种基于神经网络和贝叶斯决策的人脸检测方法人脸识别是指基于已知的人脸样本库,利用图像处理和模式识别技术从静态或动态场景中,识别或验证一个或多个人脸。人脸识别技术在国家重要机关及社会安防领域具有广泛而特殊的用途。人脸识别技术还可应用于多媒体数据库的视频检索以及多媒体制作方面。近几年,基于人脸识别技术的表情信息提取也成为可能,它可用于改进人机交互方式,从而产生更加人性化、智能化的计算机系统。 一个自动的人脸识别系统的工作可以划分为六个部分,即人脸检测与分割、人脸的规范化、人脸表征、人脸识别、主体类型、表情姿态分析。这六个部分并不是完全孤立的,而是紧密相关的。人脸检测是自动人脸识别技术的基础,影响着

2、后续人脸识别的精度和速度,是人脸识别技术实用化所必须解决的一个重要课题,只有快速有效地检测出人脸,才能保证识别的即时性与准确性。 现有人脸检测算法可分为基于肤色特征的方法、基于灰度和纹理的方法、基于主成分分析的方法、基于支持向量机的方法、基于模板匹配的方法、基于人工神经网络的方法。人脸检测算法的界限也并不是绝对的,结合几种思想于一体的检测方法也普遍存在。一般先用一种检测方法(如基于差影法的粗分割或基于彩色图像的粗分割)提取出疑似人脸所在的区域,然后再用另一种检测方法(如用模板匹配或神经网络)对这部分进行再验证,而且这些技术均取得了良好的检测效果。所以本文假定已经有一种算法提取了疑似人脸,现通过

3、建立BP神经网络模型,对疑似人脸进行仿真输出,并用贝叶斯决策对输出进行人脸与非人脸的判别修正。通过实验分析表明使用神经网络进行仿真的判别是快速有效的,使用贝叶斯决策进行全局的分析统筹也达到了进一步提高判别率的目标,表明了使用贝叶斯决策理论的必要性。 1用BP神经网络仿真疑似人脸 11网络模型 本算法将人脸区域看做一类模式,这里的人脸区域指上至额头下至下颌的正方形区域,使用大量的人脸与非人脸样本训练构造分类器,通过判别图像中所有可能区域属于哪类模式的方法实现人脸的检测。构造精确的分类器是实现人脸检测的关键,在疑似人脸的定位方面已经有了大量的算法设计,因此本文具体介绍了利用神经网络进行判别分类的有

4、关内容,而对疑似人脸定位部分的内容不作介绍。 12BP网络结构的设计 误差反向传播算法(error back propagation),简称BP算法。采用BP算法的多层神经网络模型一般称为BP网络。它是目前人工神经网络中研究最深入、应用最广泛的一类网络。BP网络由输入层、隐藏层和输出层组成。隐藏层可以是一层或多层。本文采用的是两层BP网络,即隐藏层只有一层。 1)输入、输出层的设计 大多数基于神经网络的方法使用的输入窗口的大小都是2020像素。这个窗口包含了人脸非常关键的部分,它可以保留人脸的主要信息、忽略次要信息。笔者同样采用的是2020像素大小的窗口,因此,将输入层节点数设置为 400,对

5、应于2020像素图像窗口中按行展开的各个像素。考虑到本文使用的BP网络是做作分类器,其类别数为2(即人脸和非人脸),所以输出层的节点数为1,即输出向量是一维的;当训练的样本为人脸时,输出向量的值为1,当训练的样本为非人脸时,输出向量的值为0。 2)隐藏层节点数的选择 隐藏层节点数的选择是一个比较复杂的问题。如果数目过少,网络将不能建立复杂的判断依据,无法训练成功或网络不“强壮”,不能识别以前没有见过的样本,容错性差;但如果数目过多,就会使学习时间过长,网络的泛化能力降低,而且误差也不一定最佳,因此存在一个最佳的隐藏层节点数。这里的解决办法是先根据经验公式: 计算出隐藏层节点数的初始取值,然后进

6、行网络训练,计算网络收敛时间后再给n加1,重新开始训练,记录收敛时间,通常是随着n的增加,网络的收敛速度会加快。当网络收敛速度保持基本恒定时,这个n值就是最适当的隐藏层节点数目。通过多次试验,均衡网络的收敛速度和识别率,将隐藏层的节点数目定为13。 13训练过程 BP神经网络的训练过程是根据样本集对神经元之间的连接权进行调整的过程。其样本集由形如: 的向量对构成。所有这些向量对,都应该是来源于网络即将模拟系统的实际运行结果。它们是从实际运行系统中采集来的。开始训练前,所有的权都应该用一些不同的小随机数进行初始化。BP算法主要包含两个阶段: 14使用神经网络进行判别的实验 分类器的形成与网络的结

7、构和样本的选取有很大的关系。不同的网络结构,在训练集相同的情况下网络的收敛速度和网络分类的正确率是不同的。在网络结构确定的情况下,如果样本选得比较合理,分类器就能对人脸和非人脸进行正确的分类,因为这些样本能帮助分类器学习人脸和非人脸的精确界限。良好的样本选择可以产生良好收敛的网络,而且具有良好的泛化性能。从后面的实验数据上也可以看出这一点。 本文选用的是MITEx人脸库,它是对MIT人脸库的扩展,MIT 人脸数据库由麻省理工大学多媒体实验室创建的,包含16 位志愿者的2 592 张不同姿态、光照和大小的面部图像。MITExr人脸库共计图像7 089张,所有图像均大小缩放到了2020像素。其中人

8、脸图片2 707幅,包括了不同性别、不同姿态(面部偏转)、不同表情、不同光照以及是否带眼镜、是否留胡须等的人脸样本。其中扩充了400幅亚洲人的人脸样本。非人脸图片共计4 382幅。其中包括风景、背景、墙体、纹理、不完整的人脸、人的远景照、大幅偏转的人脸和残损的图片等。 现选取了其中的人脸图片和非人脸图片各2 000幅,将其分为两组,每组包含有相同数目的人脸图片和非人脸图片。第一组用于网络训练;第二组用于网络测试。实验步骤如下: a)将所有训练样本图像均衡化。 b)依次提取每个样本图像的像素灰度值,共400个,将它们以400维列向量的形式存储。 c)将每个样本图像的像素灰度值列向量输入神经网络,

9、设定网络训练的收敛目标和输出结果,进行网络训练。 d)对测试图片进行均衡化,输入其像素灰度值列向量进行仿真测试,收集测试结果。 e)分析测试结果。 本文组织了多次网络的训练和测试,选取典型的两次分析总结如下: 实验一将网络的收敛目标为设定为0.01,用包括人脸和非人脸在内的2 000幅图像作为训练样本;另外2 000幅进行测试。测试结果如表1所示。 实验二将收敛目标设置为0.001,选用4 000个图像中的1/3,即1 333张作为训练样本,而用剩下的2 666张作为测试数据。参照表1可以看出,第二次的测试结果明显好于第一次,究其原因有两点:实验二的收敛目标定得比实验一严格;实验二的训练选用了

10、具有代表性的数据,提高了网络的泛化能力。让网络学习到了更丰富更广泛的信息。 网络的输出是一个一维的向量,即判断一个图像是不是人脸依靠的是这个一维的数值,依照网络的设计,应该将评判人脸与非人脸的阈值定为0.5,然而实际测试数据输出值的范围从是人脸为0028 2,1618 3,非人脸为-0983 7,1270 8。其分布如图1所示,可以看出人脸数据的输出比较集中,而非人脸的比较分散,并且它们两者之间有相当程度的交叉,如果只是简单地将0.5作为阈值判断就无法取得最佳的分类效果,在分类时,确定的阈值在人脸的概率密度函数和非人脸的概率密度函数交点处才能比较公正。鉴于按照神经网络的训练输出设定的阈值05并

11、不能被证明是位于此交点。所以有必要采用贝叶斯决策理论来辅助决策仿真结果所在的模式类。 2用贝叶斯决策提高判别的正确率 21总体分布的非参数估计 对于经由神经网络仿真的结果,在使用贝叶斯理论决策分类时是被当做样本来看待的。所以,后续文章中的样本指的就是网络的输出结果,而不是原始的人脸或非人脸的训练及测试图像。 要利用贝叶斯决策理论提高正确率就需要在预先知道样本的先验概率和每一个测试数据的条件概率密度函数的情况下,按一定的决策规则确定判别函数和决策面。但目前类条件概率密度是未知的。这就需要利用样本设计分类器。从样本集推断总体概率分布的方法可以归结为监督参数估计、非监督参数估计、非参数估计。由样本的

12、直方图可以看出,人脸和非人脸的样本分布并不是很完善的正态分布,所以本文基于第三种方法非参数估计的相关原理,提出了一种简单易行的统计方法对样本集进行了分析,并产生出了计算某个样本对于人脸和非人脸的条件概率密度的方法。步骤如下: a)分别绘制样本的分布直方图,并分别存储其分布矩阵。 b)计算每个样本所对应的点在人脸和非人脸直方图中的小区域。 c)分别统计在这个小区域中的所有数据的个数,得到了这一点的一个小范围在人脸和非人脸类中的分布频度,即认为是这一点条件概率密度。 22基于最小错误率的贝叶斯决策 23使用贝叶斯决策进行统筹修正的实验 由神经网络仿真结果可得到2 666个样本,如果对所有的样本进行

13、统计,归纳出概率密度算法,并对这2 666个数据进行二次分类可以得到如表2所示的实验一和试验三的结果,它们两者的区别在于,设定采样密度的不同,即样本值在直方图中的点所在的小区域的大小不同。而实验二则使用了一半样本用于统计,用另一半进行测试分类,同样也取得了很好的检测效果。与将神经网络仿真结果直接以0.5为阈值的分类相比,采用贝叶斯决策理论后,正确率平均提升了3.63%,平均错误率下降了3.19%。绘制贝叶斯决策结果的直方图如图2所示,可以看出获得了非常良好的区分效果。因为本文采用的是基于最小错误率的贝叶斯决策理论,所以与神经网络检测结果相比,误检率有了大幅的下降,漏检率有小幅的上升。如果在实际应用中考虑到漏检和误检的风险,就需要设定损失权值,使用基于最小错误率贝叶斯决策的升级理论基于最小风险的贝叶斯决策。 3结束语 根据BP神经网络原理,本文提出了一种判断疑似人脸区域是否真正存在人脸的方法,并使用MITEx数据库进行训练和测试,选用的训练样本具有良好的代表性,使整个网络具有了很好的泛化性能,也得出了令人满意的实验结果,有较好的判别率。但是这种判别有其自身的缺点,它忽略了测试数据输出的整体分布,所以使用贝叶斯决策参照神经网络的仿真结果,再作了一个二次判断。经过实验测试,判别率得到了进一步的提高,这表明这种二次贝叶斯决策是有效的而且也是必要的。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1