判别函数线性判别函数线性判别函数的.ppt

上传人:本田雅阁 文档编号:2595846 上传时间:2019-04-15 格式:PPT 页数:56 大小:929.01KB
返回 下载 相关 举报
判别函数线性判别函数线性判别函数的.ppt_第1页
第1页 / 共56页
判别函数线性判别函数线性判别函数的.ppt_第2页
第2页 / 共56页
判别函数线性判别函数线性判别函数的.ppt_第3页
第3页 / 共56页
判别函数线性判别函数线性判别函数的.ppt_第4页
第4页 / 共56页
判别函数线性判别函数线性判别函数的.ppt_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《判别函数线性判别函数线性判别函数的.ppt》由会员分享,可在线阅读,更多相关《判别函数线性判别函数线性判别函数的.ppt(56页珍藏版)》请在三一文库上搜索。

1、 2-1、判别函数 2-2、线性判别函数 2-3、线性判别函数的性质 2-4、广义线性判别函数 2-5、非线性判别函数,第二章 判别函数,假设对一模式X已抽取n个特征,表示为: 模式识别问题就是根据模式X的n个特征来判别模式属于1 ,2 , , m 类中的那一类。, 2-1 判别函数,例如下图:三类的分类问题,它们的边界线就是一个判别函数,2.1 判别函数(续),判别函数包含两类: 一类 是线性判别函数: 线性判别函数 广义线性判别函数 (所谓广义线性判别函数就是把非线性判别函数映射到另外一个空间变成线性判别函数) 分段线性判别函数 另一类是非线性判别函数,2.1 判别函数(续), 2-2 线

2、性判别函数,我们现在对两类问题和多类问题分别进行讨论。 (一)两类问题 即: 1. 二维情况 :取两个特征向量 这种情况下 判别函数:,在两类别情况,判别函数 g (x) 具有以下性质: 这是二维情况下判别由判别边界分类. 情况如图:,1. 二维情况,2. n维情况,现抽取n个特征为: 判别函数: 另外一种表示方法:,模式分类: 当 g1(x) =WTX=0 为判别边界 。当n=2时,二维情况的判别边界为一直线。当n=3时,判别边界为一平面,n3时,则判别边界为一超平面。,2. n维情况,(二) 多类问题,对于多类问题,模式有 1 ,2 , , m 个类别。可分三种情况: 1。第一种情况:每一

3、模式类与其它模式类间可用单个判别平面把一个类分开。这种情况,M类可有M个判别函数,且具有以下性质:,右图所示,每一类别可用单个判别边界与其它类别相分开 。 如果一模式X属于1,则由图可清楚看出:这时g1(x) 0而g2(x) 0 , g3(x) 0 。 1 类与其它类之间的边界由 g1(x)=0确定.,1。第一种情况,例:已知三类1,2,3的判别函数分别为:,因此三个判别边界为:,1。第一种情况(续),作图如下:,1。第一种情况(续),对于任一模式X如果它的 g1(x) 0 , g2(x) 0 , g3(x) 0 则该模式属于1类。相应1类的区域由直线-x2+1=0 的正边、直线-x1+x2-

4、5=0 和直线-x1+x2=0的负边来确定。,1。第一种情况(续),必须指出,如果某个X使二个以上的判别函数 gi(x) 0 。则此模式X就无法作出确切的判决。如图中 IR1,IR3,IR4区域。 另一种情况是IR2区域,判别函数都为负值。IR1,IR2,IR3,IR4。都为不确 定区域。,1。第一种情况(续),问当x=(x1,x2)T=(6,5)T时属于那一类 结论: g1(x) 0 , g3(x) 0所以它属于2类,1。第一种情况(续),这样 有 M(M _ 1)/2个判别平面。 对于两类问题,M=2,则有一个判别平面。 同理,三类问题则有三个判别平面。,判别函数: 判别边界: 判别条件:

5、,2。第二种情况:,每个模式类和其它模式类间可分别用判别平面分开。,判别函数性质: 假设判别函数为:,判别边界为:,2。第二种情况(续),用方程式作图:,问:未知模式X=(x1,x2)T=(4,3)T属于那一类,代入判别函数可得: 把下标对换可得: 因为 结论:所以X 属于3类,结论:判别区间增大,不确定 区间减小,比第一种情况小的多.,2。第二种情况(续),3。第三种情况,判别函数: 判别规则: 判别边界: gi(x) =gj(x) 或gi(x) -gj(x) =0 就是说,要判别模式X属于那一类,先把X代入M个判别函数中,判别函数最大的那个类别就是X所属类别。 类与 类之间的边界可由 gi

6、(x) =gj(x) 或gi(x) -gj(x) =0来确定。,每类都有一个判别函数,存在M个判别函数,右图所示是M=3 的例子。对于1类模式, 必然满足g1(x) g2(x) 和 g1(x) g3(x) 。 假设判别函数为: 则判别边界为:,3。第三种情况(续),结论:不确定区间没有了,所以这种是最好情况。,用上列方程组作图如下:,3。第三种情况(续),问假设未知模式x= (x1,x2)T= (1,1)T ,则x属于那一类。 把它代入判别函数: 得判别函数为: 因为 所以模式x= (1,1)T属于 类。,3。第三种情况(续),2-3、线性判别函数的性质,1、模式空间与加权空间 模式空间:由

7、构成的n维欧氏空间。 W是此空间的加权向量,它决定模式的分界面H,W与H正交。 加权空间:以 为变量构成的欧氏空间 模式空间与加权空间的几何表示如下图:,模式空间,1、模式空间与加权空间(续),该式表示一个通过加权空间原点的平面,此平面就是加权空间图中的平面,同样令g (x2) =g (x3) =g (x4)=0,分别作出通过加权空间原点的平面图中用阴影表示的部分是各平面的正侧。,加权空间的构造: 设 是加权空间分界面上的一点,代入上式得:,1、模式空间与加权空间,这是一个不等式方程组,它的解 处于由1类所有模式决定的平面的正边和由2类所有模式决定的平面的负边,它的解区即为凸多面锥。 如图所示

8、:(b)为加权空间,(c)为正规化后的加权空间。 由上可以得到结论:加权空间的所有分界面都通过坐标原点。这是加权空间的性质。 为了更清楚,下面用二维权空间来表示解向量和解区。,1、模式空间与加权空间(续),在三维空间里,令w3 = 0 则为二维权空间。如图: 给定一个模式X,就决定一条直线: 即分界面H,W与H正交,W称为解向量。 解向量的变动范围称为解区。 因x1,x21, x3,x42由图可见x1,x3离的最近,所以分界面H可以是x1,x3之间的任一直线,由垂直于这些直线的W就构成解区,解区为一扇形平面,即阴影区域。 如右图:,2、解向量和解区,把不等式方程正规化:,正规化:,2、解向量的

9、解区(续),g(x)=WTX=0决定一个决策界面,当g(x)为线性时,这个决策界面便是一个超平面H,并有以下性质: 性质:W与H正交(如图所示) 假设x1,x2是H上的两个向量 所以 W 与(x1-x2) 垂直,即W与H正交。 一般说,超平面H把特征空间分成两个半空间。即1,2空间,当x在1空间时g(x)0,W指向1,为H的正侧,反之为H的负侧.,3、超平面的几何性质,3、超平面的几何性质,矢量到H的正交投影 与 值成正比,其中: x p: x在H 的投影向量, r是x 到H 的垂直距离。 是W方向的单位向量。,3、超平面的几何性质(续),性质 :,另一方面:,3、超平面的几何性质(续),这是

10、超平面的第二个性质,矢量x到超平面的正交投影 正比与g(x)的函数值。,性质:,3、超平面的几何性质(续),3、超平面的几何性质(续),一组模式样本不一定是线性可分的,所以需要研究线性分类能力的方法,对任何容量为N的样本集,线性可分的概率多大呢? (如下图(a),线性不可分) 例:4个样本有几种分法。 图(b)直线把x1分开,每条直线可把4个样本分成1 2 类,4个样本分成二类的总的可能的分法为24=16类,其中有二种是不能用线性分类实现的线性可分的是14。即概率为14/16。,4。二分法能力,结论:N个样品线性可分数目(条件:样本分布良好):,4。二分法能力(续),对N和n各种组合的D(N,

11、n)值,表示在下表中,从表中可看出,当N,n缓慢增加时D(N,n)却增加很快。,4。二分法能力(续),线性可分概率:,把上式用曲线表示成下图:图中横坐标用=N/n+1表示。 由图讨论:,4。二分法能力(续),结论:在实际工作中,分类的训练非常重要,由已知样本来训练。因为已知样本有限,而未知样本无限。选择已知类别的训练样本数方法如下:,4。二分法能力(续),:如果训练样本N N0,设计分类器的分类能力太差,因为训练样本太少。 :如果训练样本N太多时,则样本太多,运算量、存储量太大。 :因此实际工作中应该取: ,4。二分法能力(续),2-4、广义线性判别函数,这样一个非线性判别函数通过映射,变换成

12、线性判别函数。,判别函数的一般形式:,2-4、广义线性判别函数(续),例:如右图。,2-4、广义线性判别函数(续),要用二次判别函数才可把二类分开:,2-4、广义线性判别函数(续),从图可以看出:在阴影上面是1类,在阴影下面是2类, 结论:在X空间的非线性判别函数通过变换到Y空间成为线性的,但X变为高维空间,1.分段线性判别函数(用线性无法分开,可用分段线性判别函数) 、基于距离的分段线性判别函数。(用均值代表一类,通过均值连线中点的垂直线分开) 把i类可以分成li个子类: 分成l个子类。 现在定义子类判别函数: 在同类的子类中找最近的均值。 判别规则: 这是在M类中找最近均值。则把x归于j类

13、完成分类。,2-5、非线性判别函数,2-5、非线性判别函数(续),例:未知x,如图: 先与1类各子类的均值比较,即 ,找一个最近的 与2各子类均值比较取最近的 因g2(x) g1(x) ,所以x2类 。,设 1, 2 ,m 而每一类又可以分为 子类。 对每个子类定义一个线性判别函数为: 则定义i类的线性判别函数为:,、基于函数的分段线性判别函数 利用均值代表一类有时有局限性,如图所示。若用 线性判别函数代表一类,就会克服上述情况。,1、分段线性判别函数,在各子类中找最大的判别函数作为此类的代表,则对于M类,可定义M个判别函数gi(x),i=1,2,M,因此,决策规则: 对未知模式x,把x先代入

14、每类的各子类的判别函数中,找出一个最大的子类判别函数,M类有M个最大子类判别函数,在M个子类最大判别函数中,再找一个最大的,则x就属于最大的子类判别函数所属的那一类。,1、分段线性判别函数(续),、基于凹函数的并分段线性判别函数(针对多峰情况) 设li子类判别函数,i=1,2,r则分段线性判别函数有如下特性:,1、分段线性判别函数(续),(a):l1,l2,lr都是分段线性判别函数 (b):若A,B都是分段线性判别函数,则: AB ,AB也是分段线性判别函数。 AB取最小 ,AB取最大。 (c):对任何分段线性函数都可以表示成如下二种形式:,1)、析取范式(这是经常采用的形式) P=(L11L

15、12L1m)(Lq1Lq2Lqm) 2)、合取范式 Q= (L11 L12 L1m) (Lq1 Lq2 Lqm) 每个(L11 L12 L1m) 都称为凹函数。,1、分段线性判别函数(续),对于多峰二类问题:设第一类有q个峰,则有q个凹函数。 即P=P1P2Pq 每个凹函数Pi由m 个线性判别函数来构成。 Pi=Li1Li2Lim 假设对于每个子类线性判别函数Lij都设计成:,例、设如图,1、分段线性判别函数(续),P=(L11L12 L13 L14 L15) (L21L22 L23 L24) (L31L32 L33 L34),2、二次判别函数,二次判别函数一般可表示成:,2、二次判别函数(续),2、二次判别函数(续),关于二次判别函数,我们将在贝叶斯分类器中详细论述。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1