纸型识别的数学模型—Bayes多组.doc

上传人:啊飒飒 文档编号:10255578 上传时间:2021-05-03 格式:DOC 页数:11 大小:412.50KB
返回 下载 相关 举报
纸型识别的数学模型—Bayes多组.doc_第1页
第1页 / 共11页
纸型识别的数学模型—Bayes多组.doc_第2页
第2页 / 共11页
纸型识别的数学模型—Bayes多组.doc_第3页
第3页 / 共11页
纸型识别的数学模型—Bayes多组.doc_第4页
第4页 / 共11页
纸型识别的数学模型—Bayes多组.doc_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《纸型识别的数学模型—Bayes多组.doc》由会员分享,可在线阅读,更多相关《纸型识别的数学模型—Bayes多组.doc(11页珍藏版)》请在三一文库上搜索。

1、纸型识别的数学模型Bayes多组判别分析一、 问题的提出:在公安侦破工作中,需要诊断根据某一碳化纸张化学成分的分析数据以识别这一纸类的属性,为进一步的侦破提供准确的数量依据。二、纸型识别的数据模型Bayes多组判别分析1. 模型:我们知道,在两组判别分析时,确定样品的归属是用一个线性判别函数式(在m=2时,判别函数为一个平面),把整个空间划分为二个区域。那么,在三组情况下,就需要三个判别函数式把整个空间划分为,四组就要求6个判别函数式。这样,随着组数的增加,判别函数是个数就增加很快,使用中很不方便。因此,对于多组判别,我们不是计算组间判别函数式,而是计算新给样品属于各组的概率,即对于一个新给样

2、品的观测数据,判别它到底属于已知个组的哪一组的方法,是计算属于第组的概率,比较的大小,将这个样品归入概率最大的这一组。如果 将这个样品归入概率最大的第k*这一组。2数据:已知有个样品,每个样品有个指标的观测数据,而个样品又分别归属于个组,且每个组样品个数不一定相等,设第组的样品个数为。因此,对于每个已知观测数据可以写成下列的形式: 其中,表示第组,第个样品,第个指标的观测数据,而第一组样品的观测数据是:第组样品的观测数据是:上面这个组样品时已知根据所研究各种纸类的各种指标来进行划分的。现在的目的是要对已知划分为个组样品,根据个指标的观测数据求出判别函数,以便于对于任何一个未知样品(一般来说,并

3、非上面这个已知的样品之一),都可根据这个样品的个指标的观测数据,通过判别函数判断它应该属于哪一组。因此,这个方法的关键就是要给出一个计算的公式,下面就来给出的计算公式及其相应的理论说明。设是第组第个样品第个变量(指标)的观测数据,假设各组的样品都是相互独立的正态随机向量,即其中,是组个变量的数学期望(向量)、是相应于第组个变量的协方差矩阵,在条件中,我们假定即个组的协方差矩阵是一样的,所不同的仅是个均向量。于是根据个样品就可估计各组的及协方差矩阵。由多元正态估计,相应的估计量是:(1) 其中 把这些估计量代入各组的分布密度表达式内,就得到各组的各变量的联合分布密度。以第组为例,变量在第组的概率

4、密度其中,为总的协方差矩阵,是逆矩阵的第行第列上的元素。任意给定一个新的样品,观察此样品的个变量所取得的值是,假定这个样品来自各组的可能性是一样的。于是,由贝叶斯公式,可以根据的数据算出这个样品来自第组的概率 (称为后验概率,它的贝叶斯解可参看1) 其中,为样品 在第组的概率密度,它可由(15)算出;为第组的先验概率,实际应用中往往把样品的频率作为先验概率的估计值,即因之,我们判别的准则是使为最大。事实上,如果概率密度为已知,且样品来自各组的可能性是一样的,则我们可以建立判别函数如果则把样品划归第组,所以,在判别是,我们只关心寻求使判别函数为最大的由于故可对上式分子取对数:其中及与有关,分别令

5、则于是 从而由(19),使为最大的其必为最大,因之,我们只许把样品代入(18)式中,分别计算出:若则把样品划归第,成为多组判别的判别函数。3计算步骤(1) 计算每组各个变量的平均值:(2) 计算各组的离差矩阵:用表示第组的离差矩阵,用小写字母表示中第行第列上的元素即(3) 计算总的协方差矩阵:(4) 求的逆矩阵(5) 计算各组的判别函数:设是逆矩阵的第行,则计算(22) 由、可以定出第组的判别函数:(23) (6) 计算新样品属于第组的概率:(7) 计算分类矩阵:矩阵的元素用表示, 的数值是 =原属第组的个样品经用计算后重新分组时属于第组的个数。 很明显,如果, 那就说明计算出后再判别属于哪一

6、组的准确率(对原来的个样品来说)达到了百分之百,可见,与越接近越好。 4辅助性检验 在实际工作中,已知个样品分成个组,组与组之间的差别客观上是清楚的,然而,有可能由于我人选取的变量没有反映组间的差别,因此需要观察一下这个变量是否有能力来区分这个组。这就要用广义的马哈拉诺比斯统计表量来进行检验。的计算步骤如下:(1) 计算各个变量总的平均值 (2) 用3中求得的计算(24) 而统计量遵从个自由度分布(在正态分布各组之间均值,协方差全部相同的情况下)查表就可定出的临界值,当算出的大于临界值时,可能断定这个变量是能鉴别这个组的,否则,就表明这个变量还不足以鉴别这个组,应引入一些新的变量。5成果的有效性:经对常用的531个纸样及17个模拟样的纸类鉴别,准确率达到100%。对于案件侦破中提出的纸型予以识别确诊,有力地支持了破案工作,获公安部的认可。此项分别获1987公安部科技进步三等奖,采取边研究边办案的方法,成功地侦破了鸦片走私、盗窃钱粮、敌特文件和匿名恐吓文件等多起案件。获1988年云南省科技进步三等奖。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1