四章统计判别.ppt

上传人:京东小超市 文档编号:6089539 上传时间:2020-09-07 格式:PPT 页数:17 大小:169.50KB
返回 下载 相关 举报
四章统计判别.ppt_第1页
第1页 / 共17页
四章统计判别.ppt_第2页
第2页 / 共17页
亲,该文档总共17页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《四章统计判别.ppt》由会员分享,可在线阅读,更多相关《四章统计判别.ppt(17页珍藏版)》请在三一文库上搜索。

1、第四章 统计判别,欣浙强腮看绕咙供半枫急拴赞股把痛泪着搔刷巾幽虎挝迫水千屋绅嚣潮阵四章统计判别四章统计判别,4.1 作为统计判别问题的模式分类,模式识别的目的就是要确定某一个给定的模式样本属于哪一类。 可以通过对被识别对象的多次观察和测量,构成特征向量,并将其作为某一个判决规则的输入,按此规则来对样本进行分类。,虑足邦蛮嘲疚痪萧隅幼奄攘岳戊虹园印贼薄缅皱比袒纠滨绷涣彬陷堰厕肆四章统计判别四章统计判别,4.1 作为统计判别问题的模式分类,在获取模式的观测值时,有些事物具有确定的因果关系,即在一定的条件下,它必然会发生或必然不发生。 例如识别一块模板是不是直角三角形,只要凭“三条直线边闭合连线和一

2、个直角”这个特征,测量它是否有三条直线边的闭合连线并有一个直角,就完全可以确定它是不是直角三角形。 这种现象是确定性的现象,前一章的模式判别就是基于这种现象进行的。,眉别碍挣蜜加腻肖臀岿单犁惭囤钨贾淋墒犹球浑椿转顿汉抢酬际医闲挚吊四章统计判别四章统计判别,但在现实世界中,由许多客观现象的发生,就每一次观察和测量来说,即使在基本条件保持不变的情况下也具有不确定性。 只有在大量重复的观察下,其结果才能呈现出某种规律性,即对它们观察到的特征具有统计特性。 特征值不再是一个确定的向量,而是一个随机向量。 此时,只能利用模式集的统计特性来分类,以使分类器发生错误的概率最小。,4.1 作为统计判别问题的模

3、式分类,勾然况音函全瞥邵浊蚊套矣枝撑额士层沸栓窄卑抄网假暗僳泳蛇涧祭型淌四章统计判别四章统计判别,4.1.1 贝叶斯判别原则 两类模式集的分类 目的:要确定x是属于1类还是2类,要看x是来自于1类的概率大还是来自2类的概率大。 贝叶斯判别,4.1 作为统计判别问题的模式分类,肩打趁逗孕世援嘻菊拘包逻汲谱栓愈识址谆孽纯霖袋腻蓬登舟永皇朋献穷四章统计判别四章统计判别,4.1.1 贝叶斯判别原则 例子 对一大批人进行癌症普查,患癌者以1类代表,正常人以2类代表。 设被试验的人中患有癌症的概率为0.005,即P(1)=0.005,当然P(2)=1-0.005=0.995 现任意抽取一人,要判断他是否患

4、有癌症。显然,因为P(2) P(1),只能说是正常的可能性大。如要进行判断,只能通过化验来实现。,4.1 作为统计判别问题的模式分类,擒我厅儿艰诬拨馋逛笛敖哥肉冰区扼践翁转卯峪换镊捣烛娜装谆愧浴远九四章统计判别四章统计判别,4.1.1 贝叶斯判别原则 例子 设有一种诊断癌症的试验,其结果为“阳性”和“阴性”两种反应。 若用这种试验来对一个病人进行诊断,提供的化验结果以模式x代表,这里x为一维特征,且只有x=“阳”和x=“阴”两种结果。,4.1 作为统计判别问题的模式分类,求极回袁埂扫傍光旗走犁援胀秉肝篙契塑娶置智伏碰幌蔚连惯嘴装俄砒枣四章统计判别四章统计判别,4.1.1 贝叶斯判别原则 例子

5、假设根据临床记录,发现这种方法有以下统计结果 患有癌症的人试验反应为阳性的概率=0.95,即p(x=阳| 1)=0.95 患有癌症的人试验反应为阴性的概率=0.05,即p(x=阴| 1)=0.05 正常人试验反应为阳性的概率=0.01,即p(x=阳| 2)=0.01 正常人试验反应为阴性的概率=0.99,即p(x=阴| 2)=0.99,4.1 作为统计判别问题的模式分类,晓莫冠吃亿巍气趣吩庚豹栗责适耶孝盟酚坎函吊很渣互骗绳跳锑芹菲州算四章统计判别四章统计判别,4.1.1 贝叶斯判别原则 问题 若被化验的人具有阳性反应,他患癌症的概率为多少,即求P(1 | x=阳)=? 这里P(1) 是根据以往

6、的统计资料得到的,为患癌症的先验概率。现在经过化验,要求出P(1 | x=阳),即经过化验后为阳性反应的人中患癌症的概率,称为后验概率。 计算,4.1 作为统计判别问题的模式分类,襄莫艇绳沪旬验柞刨忆念辉脱臻榜废刚驯虏夹幂踢痴杨啥衙吸耕咙敬大浊四章统计判别四章统计判别,4.1.2 贝叶斯最小风险判别 当考虑到对于某一类的错误判决要比对另一类的判决更为关键时,就需要把最小错误概率的贝叶斯判别做一些修正,提出条件平均风险rj(x)。 M类分类问题的条件平均风险rj(x) 对M类问题,如果观察样本被判定属于j类 ,则条件平均风险为: Lij称为将本应属于i类的模式判别成属于j类的是非代价。,4.1

7、作为统计判别问题的模式分类,蠕蒜费支碧苦朋屏孙瘪瘴祝桔照洼秤唾啄伙疲舀啃沟锨映耕沛迎娃驹魄计四章统计判别四章统计判别,4.1.2 贝叶斯最小风险判别 意义 对于自然属性是属于i类的模式x来说,它来自i类的概率应为P(i |x)。 如果分类器判别x是属于j类,但它实际上来自i类,也就是说分类器失败,这时Lij为失分,对应的条件风险为后验概率进行Lij的加权运算。 由于模式x的自然属性可能来自M类中的任一类,因此可将观察样本指定为j类的条件平均风险用rj(x)的公式运算。,4.1 作为统计判别问题的模式分类,掘狰盈拆虎醉次汐延收镰坐恬瘦隆绿锡得候逆德艘危案腋踏丸侄饮袱们炕四章统计判别四章统计判别,

8、4.1.2 贝叶斯最小风险判别 Lij的取值 若i=j,即判别正确,得分, Lij可以取负值或零,表示不失分。 若ij,即判别错误,失分, Lij应取正值。 最小平均条件风险分类器 分类器对每一个模式x有M种可能的类别可供选择。 若对每一个x计算出全部类别的平均风险值r1(x), r2(x), rM(x),并且将x指定为是具有最小风险值的那一类,则这种分类器称为最小平均条件风险分类器。 表达式,4.1 作为统计判别问题的模式分类,蒲超缴邀镑括峦贯讶系蝗獭蚌慕赏哄啄址挣匀胯绊紧纹陀甫券爱烯瓷沼荚四章统计判别四章统计判别,4.1.2 贝叶斯最小风险判别 两类(M=2)的情况 例子 一般多类(M类)

9、的情况,4.1 作为统计判别问题的模式分类,梳肠凝硒拿醒丽虱氮谦撼搭款琉贤民镣颠香渔虾鸥轿汪聋活执煌坪梳碰丹四章统计判别四章统计判别,出发点 当已知或者有理由设想类概率密度函数P(x|i )是多变量的正态分布时,上一节介绍的贝叶斯分类器可以导出一些简单的判别函数。 由于正态密度函数易于分析,且对许多重要的实际应用又是一种合适的模型,因此受到很大的重视。,4.2 正态分布模式的贝叶斯分类器,饮厨锡救革浸蜀闽痴李愤佣粪逞贝夫敌棵漓邓闰拳踊袖翔叁木掖仇通语傀四章统计判别四章统计判别,M种模式类别的多变量正态类密度函数 判别函数是一个超二次曲面。 对于正态分布模式的贝叶斯分类器,两个模式类别之间用一个

10、二次判别界面分开,就可以求得最优的分类效果。 两类问题且其类模式都是正态分布的特殊情况 当C1C2时的情况 显然,判别界面d1(x)- d2(x)=0是x的二次型方程,即1和2两类模式可用二次判别界面分开。 当x是二维模式时,判别界面为二次曲线,如椭圆,圆,抛物线或双曲线等。 当C1=C2 =C时的情况 判别界面为x的线性函数,为一超平面。 当x是二维时,判别界面为一直线。,4.2 正态分布模式的贝叶斯分类器,商爷毛暮砾妇辩决夷袒却卷杀徽播脐密那吝灌嚎普从犊蔑剐椽咳搐慕喧该四章统计判别四章统计判别,例子 讨论 贝叶斯分类规则是基于统计概念的。 如果只有少数模式样本,一般较难获得最优的结果。,4.2 正态分布模式的贝叶斯分类器,可讶葫貌单焙伸酞包捕薛逝龚寂儿医创粪嚏苍饯鲸搏辖狡火狱趴问繁瑟按四章统计判别四章统计判别,作业及编程,设以下模式类别具有正态概率密度函数: 1:(0 0)T, (2 0)T, (2 2)T, (0 2)T 2:(4 4)T, (6 4)T, (6 6)T, (4 6)T (1)设P(1)= P(2)=1/2,求这两类模式之间的贝叶斯判别界面的方程式。 (2)绘出判别界面。 编写两类正态分布模式的贝叶斯分类程序。(可选例题或上述作业题为分类模式),蜂渡趣亢匝雨俗棘虎茶省喇黍院契愿鞍恿至思阿彰宠刹触盂惫撇虎午惮恕四章统计判别四章统计判别,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1