模煳聚类分析.ppt

上传人:京东小超市 文档编号:6094946 上传时间:2020-09-08 格式:PPT 页数:42 大小:575.50KB
返回 下载 相关 举报
模煳聚类分析.ppt_第1页
第1页 / 共42页
模煳聚类分析.ppt_第2页
第2页 / 共42页
亲,该文档总共42页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《模煳聚类分析.ppt》由会员分享,可在线阅读,更多相关《模煳聚类分析.ppt(42页珍藏版)》请在三一文库上搜索。

1、模糊聚类分析,岸楚诞浦下巧膳泣版阴绕东悄抢翘沪衣敞揭地贴商巢痕冀猴站字阐犁哦卓模煳聚类分析模煳聚类分析,模糊矩阵,模糊矩阵 模糊矩阵间的关系及并、交、余运算 模糊矩阵的合成 模糊矩阵的转置 模糊矩阵的截矩阵,惨萍煌韧腔粪毋捌袋凹杆翟鞠澳磁餐纸恐三硷书馆纯蚜闸芍糕帝浚侦练敬模煳聚类分析模煳聚类分析,模糊矩阵,设R = (rij)mn,若0rij1,则称R为模糊矩阵. 当rij只取0或1时,称R为布尔(Boole)矩阵. 当模糊方阵R = (rij)nn的对角线上的元素rii都为1时,称R为模糊自反矩阵.,逛烫妓犀什壬赶坤舌俩臀汉堕纷毖可坤狼饶跋寡寓斥栗弱堕泻骆潦辉撼抄模煳聚类分析模煳聚类分析,模

2、糊矩阵间的关系及并、交、余运算,设A=(aij)mn,B=(bij)mn都是模糊矩阵,定义 相等:A = B aij = bij; 包含:AB aijbij; 并:AB = (aijbij)mn; 交:AB = (aijbij)mn; 余:Ac = (1- aij)mn.,媳鞍病梁戍叶歉吠净织聚僧青职惩工陵铬斯匈卖瘩蓝恫喉俘锅媳企破焙繁模煳聚类分析模煳聚类分析,设A = (aik)ms,B = (bkj)sn,称模糊矩阵 A B = (cij)mn, 为A 与B 的合成,其中cij = (aikbkj) | 1ks .,模糊方阵的幂 定义:若A为 n 阶方阵,定义A2 = A A,A3 = A

3、2 A,Ak = Ak-1 A.,模糊矩阵的合成,填响奔烯旅送拈兔年曰桓行抓届巳撇跳地撩饵蔼尿咕赎荡庸觉酝盎旋政昆模煳聚类分析模煳聚类分析,模糊矩阵的转置,定义 设A = (aij)mn, 称AT = (aijT )nm为A的转置矩阵,其中aijT = aji.,转置运算的性质:,性质1:( AT )T = A; 性质2:( AB )T = ATBT, ( AB )T = ATBT; 性质3:( A B )T = BT AT;( An )T =( AT )n ; 性质4:( Ac )T = ( AT )c ; 性质5:AB AT BT .,邢巫犬债萨罕往横恐释沤许编飘票保送茬屁丁绘缮慑通矮悄靳

4、男戍弃脐撬模煳聚类分析模煳聚类分析,模糊矩阵的截矩阵,设A = (aij)mn,对任意的0, 1,称 A= (aij()mn,为模糊矩阵A的 - 截矩阵, 其中 当aij 时,aij() =1; 当aij 时,aij() =0. 显然,A的 - 截矩阵为布尔矩阵.,远霉友到垒冯逝督障邓妻绥衷糙诺料恫徘刮废旨轴豌鸭胃哀虱腋佩涣烈纬模煳聚类分析模煳聚类分析,模糊聚类分析,模糊关系 模糊等价矩阵 模糊相似矩阵 模糊聚类分析的一般步骤,糕赏诣菜架没恕案岁鸦访眩蓟右佛彩砰氓材痢氛危少埔踏蛇讼嘴掩吨右禾模煳聚类分析模煳聚类分析,模糊关系,与模糊子集是经典集合的推广一样,模糊关系是普通关系的推广.,设有论域

5、X,Y,X Y 的一个模糊子集 R 称为从 X 到 Y 的模糊关系. 模糊子集 R 的隶属函数为映射 R : X Y 0,1. 并称隶属度R (x , y ) 为 (x , y )关于模糊关系 R 的相关程度. 特别地,当 X =Y 时,称之为 X 上各元素之间的模糊关系.,榴仑唯名庆渴盯许蜒型傻国耀露霞戮致草咐冤荡巷撤棘禹睦玖挤妊瓦珊芳模煳聚类分析模煳聚类分析,模糊关系的运算,由于模糊关系 R就是X Y 的一个模糊子集,因此模糊关系同样具有模糊子集的运算及性质.,设R,R1,R2均为从 X 到 Y 的模糊关系. 相等:R1= R2 R1(x, y) = R2(x, y); 包含: R1 R2

6、 R1(x, y)R2(x, y); 并: R1R2 的隶属函数为 (R1R2 )(x, y) = R1(x, y)R2(x, y); 交: R1R2 的隶属函数为 (R1R2 )(x, y) = R1(x, y)R2(x, y); 余:Rc 的隶属函数为Rc (x, y) = 1- R(x, y).,吨塑枉招料腕贡析病桂南浑眼窗座港腐踩洒咸教权赋灰村警豢班霍汐需潘模煳聚类分析模煳聚类分析,(R1R2 )(x, y)表示(x, y)对模糊关系“R1或者R2”的相关程度, (R1R2 )(x, y)表示(x, y)对模糊关系“R1且R2”的相关程度,Rc (x, y)表示(x, y)对模糊关系“

7、非R”的相关程度.,模糊关系的矩阵表示,对于有限论域 X = x1, x2, , xm和Y = y1, y2, , yn,则X 到Y 模糊关系R可用mn 阶模糊矩阵表示,即 R = (rij)mn, 其中rij = R (xi , yj )0, 1表示(xi , yj )关于模糊关系R 的相关程度. 又若R为布尔矩阵时,则关系R为普通关系,即xi 与 yj 之间要么有关系(rij = 1),要么没有关系( rij = 0 ).,画施蠢画搁氓哟寝截卜搔紧蹬垫掂首瞻楔懦篱炼招漾惜籍未袒械详斟吩霸模煳聚类分析模煳聚类分析,模糊关系的合成,设 R1 是 X 到 Y 的关系, R2 是 Y 到 Z 的关

8、系, 则R1与 R2的合成 R1 R2是 X 到 Z 上的一个关系. (R1 R2) (x, z) = R1 (x, y)R2 (y, z)| yY 当论域为有限时,模糊关系的合成化为模糊矩阵的合成. 设X = x1, x2, , xm,Y = y1 , y2 , , ys, Z= z1, z2, , zn,且X 到Y 的模糊关系R1 = (aik)ms ,Y 到Z 的模糊关系R2 = (bkj)sn ,则X 到Z 的模糊关系可表示为模糊矩阵的合成: R1 R2 = (cij)mn 其中cij = (aikbkj) | 1ks.,傣村老疮芳锨殿渤颧笼运愚阶荤亨契改亏薛薯佰叭闷雏嚏淡矗蛇碧款改有

9、模煳聚类分析模煳聚类分析,模糊等价矩阵,若模糊关系R是X上各元素之间的模糊关系,且满足: (1)自反性:R(x, x) =1; (2)对称性:R(x, y) =R(y, x); (3)传递性:R2R, 则称模糊关系R是X上的一个模糊等价关系.,当论域X = x1, x2, , xn为有限时, X 上的一个模糊等价关系R就是模糊等价矩阵, 即R满足:,I R ( rii =1 ),RT=R( rij= rji),R2R.,R2R ( (rikrkj) | 1kn rij) .,扦西批房斤齿穷夸吐挟概韦宪柑蛤掂痪邻衍卒揖捡缆海甘蜒太撼讳吊毋次模煳聚类分析模煳聚类分析,当时, R的分类是R分类的加细

10、.当由1变到0时, R的分类由细变粗,由模糊等价关系R确定的分类所含元素由少变多,逐步归并,最后成一类,这个过程形成一个动态聚类图,称之为模糊分类,禾厉灶铱遁顽兰前帮蓖勘猪坠贼蹋评戳空卖伙河春麻酗黑唇焉砖呢蛰整犬模煳聚类分析模煳聚类分析,故R是模糊等价矩阵 再令由1降至0,写出,按分类,城骚预爽频佛侧敬娄醛愿绵郊濒蛰跃渣乏垫辗轧诬巩鳖瑰厄揭癸喳藤阻扶模煳聚类分析模煳聚类分析,剪炸眉冲的饿抿链旱纱陇峙土栋袄公酗悸耕晋适望纠渐难介饵梁栽井钓屉模煳聚类分析模煳聚类分析, 以此类推,可以得到:,1 0.8 0.6 0.5 0.4, ,r 5 4 3 2 1,于是,得到动态聚类图如右图所示,郸侈农敖逾皮

11、饥逼矮尚姿逐昆赁炔墟贴鸭贯氖磨犹狼瞩您担捍修锤合闪蒜模煳聚类分析模煳聚类分析,模糊相似关系,若模糊关系 R 是 X 上各元素之间的模糊关系,且满足: (1) 自反性:R( x , x ) = 1; (2) 对称性:R( x , y ) = R( y , x ) ; 则称模糊关系 R 是 X 上的一个模糊相似关系. 当论域X = x1, x2, , xn为有限时,X 上的一个模糊相似关系 R 就是模糊相似矩阵,即R满足: (1) 自反性:I R ( rii =1 ); (2) 对称性:RT = R ( rij = rji ).,饲交筷药茎霍蝉缮勘龟壁直哺辑末隘革二胞墒奇掂衙磁炽淖驴篓掳弓骆腔模煳

12、聚类分析模煳聚类分析,模糊相似矩阵的性质,定理1 若R 是模糊相似矩阵,则对任意的自然数 k,Rk 也是模糊相似矩阵. 定理2 若R 是n阶模糊相似矩阵,则存在一个最小自然数 k (kn ),对于一切大于k 的自然数 l,恒有Rl = Rk,即Rk 是模糊等价矩阵(R2k = Rk ). 此时称Rk为R的传递闭包,记作 t ( R ) = Rk . 上述定理表明,任一个模糊相似矩阵可诱导出一个模糊等价矩阵.,平方法求传递闭包 t (R): RR2R4R8R16,杯朔哇狼澎富禄结爹彪粕梭卡棚脱钻厄赦唆商猾边幢炔杏把屉腾码疫匙刷模煳聚类分析模煳聚类分析,宇雾瞬军埂骆墟穷芍枫标凛秦圾调敲碟迢搪铺毁怪

13、咱律哺枢制瞳揩供允芽模煳聚类分析模煳聚类分析,模糊聚类分析的一般步骤,(1)数据标准化,设论域X = x1, x2, , xn为被分类对象,每个对象又由m个指标表示其形状: xi = xi1, xi2, , xim, i = 1, 2, , n 于是,得到原始数据矩阵为,联邱搬醇板郎膨旺答殷忽梨岗馁次岂析淀臂滥的识谆蒲炕枝汽惭笋汕堆堆模煳聚类分析模煳聚类分析,a 平移 标准差变换,其中,b 平移 极差变换,信蒂赊胺甲乃竣未侣俺奈绰盯刽包裤粒义雹虐盆腑还股鞭稿莆目洪淋阔缚模煳聚类分析模煳聚类分析,(2)建立模糊相似矩阵方法,a 相似系数法 -夹角余弦法,讽奥叮妒疡淑湖臭享颐无碟乓鹿酋蜕鹏胀刽骸瞄

14、逾宴不嗽屹厚圃失雄契银模煳聚类分析模煳聚类分析,b 相似系数法 -相关系数法,其中,炊改糙甚硼誉问搓虏疲碑夺寂斜草霖喳勤培俯喳睬子隙芝杜金喳惨侧型阳模煳聚类分析模煳聚类分析,c 距离法,海明距离,欧氏距离,兰畴倚闺滞揣抽嚏亲涪忙害槽啤仍簧当邹摸臼忻礼田踊芯扯侯柯保投址度模煳聚类分析模煳聚类分析,(3)聚类(并画出动态聚类图),从(2)求出的n阶模糊相似矩阵R出发,用平方法求其其传递闭包t(R),它就是将改造成的n阶模糊等价矩阵,再让由大变小,就可形成动态聚类图,涧庙直切儒缴狼亿欣近维遮鳖便欠买毙茫挝躲耿梯绑谐尸壹源牡凋檄掉阅模煳聚类分析模煳聚类分析,最佳分类的确定,在模糊聚类分析中,对于各个不

15、同的0,1,可得到不同的分类,从而形成一种动态聚类图,这对全面了解样本分类情况是比较形象和直观的. 但在许多实际问题中,需要给出样本的一个具体分类,这就提出了如何确定最佳分类的问题.,丰挣危嘿搁脯膳蕉秃方娄方宪伤涵谜服胜誉撵餐拔群梯讼绵豺窄能喘宽涧模煳聚类分析模煳聚类分析,称为总体样本的中心向量.对应于 值的分类数为r第 j 类的样本数为nj,第 j 类的样本标记为,第 j 类样本的中心向量为,晦蛰徒芥闻哈贬搜浴伍身每庇墓幽婪爹跟建阅惰脏生愁召改闭撂顿遣惜遗模煳聚类分析模煳聚类分析,作F- 统计量:,禹悸锋犊却佐窍窿吃缔标滦当俘痢习讲琴弛涕享困蛤糙泄廓筏瑟眷耿票淤模煳聚类分析模煳聚类分析,如果

16、满足不等式FF ( r -1, n -r )的F值不止一个,则可根据实际情况选择一个满意的分类,或者进一步考查差 ( F - F )/F 的大小,从较大者中找一个满意的F值即可.,实际上,最佳分类的确定方法与聚类方法无关,但是选择较好的聚类方法,可以较快地找到比较满意的分类.,由于F服从自由度r-1,n-r为的F分布,其分子表示类与类之间的距离,分母表示类本身的距离,那么F的值越大,则说明类与类之间的距离越大,即分类的结果越好,帧耀面讹撑润宇拴裸交顶缸逆戌缅签砸疼袋匠聊晦终评孕通妥滚虾孺杖韭模煳聚类分析模煳聚类分析,建模实例,蜢的分类 DNA序列分类,里乔燥酝涯曳酒缓粗栋氢志磐辜酷岗灶誓狠烃均

17、侯肚旺您育版颁一疑勤朝模煳聚类分析模煳聚类分析,蠓的分类,左图给出了9只Af和6只Apf蠓的触角长和翼长数据, 其中“”表示Apf,“”表示Af.根据触角长和翼长来识别一个标本是Af还是Apf是重要的., 给定一只Af族或Apf族的蠓,如何正确地区分它属于哪一族? 将你的方法用于触角长和翼长分别为(1.24,1.80), (1.28,1.84),(1.40,2.04)三个标本.,条风镰驹磊旨撂儿每毙剖纬湾幽曙绒萄俗咐咆孔绦猜怪皇紧狡趾叠般过抑模煳聚类分析模煳聚类分析,熬砌呜童仙袋坦的每撤匿伎粕恋碱角摊苗侠秀瘫出积膨臆各攒布案嚼笛邀模煳聚类分析模煳聚类分析,模糊判别方法 先将已知蠓重新进行分类.

18、,斥褐闻券哪趴扰弊幼踞热抹炒鸵资撇江沿妄刺抱酪村售歌轮懂竭凡抡失顶模煳聚类分析模煳聚类分析,当 = 0.919时,分为3类1, 2, 3, 6, 4, 5, 7, 8, 9,10, 11, 12, 13, 14, 15,三类的中心向量分别为(1.395, 1.770),(1.560, 2.080),(1.227, 1.927).,A1 = (0.200, 0.637) (Af 蠓), A2 = (0.390, 1.000) (Af 蠓), A3 = (0.000, 0.821) (Apf 蠓),再将三只待识别的蠓用上述变换分别变为,B1= (0.015, 0.672), B2 = (0.062

19、, 0.719), B3 = (0.203, 0.953 ).,辛滋粕阴迈试包置奴挤剥按习涝脑宣粤惕筒搽哉彻渺傻釜霸西表疥似本亏模煳聚类分析模煳聚类分析,采用贴近度,3 (A, B) =,计算得: 3(A1, B1) = 0. 89, 3(A2, B1) = 0.65, 3(A3, B1) = 0.92. 3(A1, B2) = 0.89, 3(A2, B2) = 0.69, 3(A3, B2) = 0.92. 3(A1, B3) = 0.84, 3(A2, B3) = 0.88, 3(A3, B3) = 0.83. 根据择近原则及上述计算结果,第一只待识别的蠓(1.24, 1.80)属于第三

20、类,即Apf 蠓;第二只待识别的蠓(1.28, 1.84)属于第三类,即Apf 蠓;第三只待识别的蠓(1.40, 2.04)属于第二类,即Af 蠓.,斥舌旱嚷惭教澡听牟角殴俘荐咙棉呜侗峨饵筑眠酶亲灾层羽作匡霓玖陷遗模煳聚类分析模煳聚类分析, 设Af是传粉益虫, Apf是某种疾病的载体, 是否应修改你的分类方法?若需修改, 为什么?,捂诲区性估则矽挎膀躁削瘸侠谎融葛溪灭槐汁涌容毖仓痕谨桐瑞旦展删折模煳聚类分析模煳聚类分析,DNA序列分类与模糊识别,2000网易杯全国大学生数学建模竞赛题:生物学家发现DNA序列是由四种碱基A,T,C,G按一定顺序排列而成,其中既没有“断句”,也没有标点符号,同时也

21、发现DNA序列的某些片段具有一定的规律性和结构. 由此人工制造两类序列(A类编号为110;B类编号为1120). 网址:. 现在的问题是如何找出比较满意的方法来识别未知的序列(编号为2140), 并判断它们那些属于A类,那些属于B类, 那些既不属于A类又不属于B类.,胆尺猎骂雨铀见逗轰糊夯淬棉滩广弥傀柠燎淬兑丙钒虐者傍阐攫琢逢押遣模煳聚类分析模煳聚类分析,(1) 已知类别DNA序列的模糊分类,提取已知类别的20个DNA序列的A,T,C,G的百分含量构成如下矩阵:X = (xij)204,其中xi1, xi2, xi3, xi4分别表示第个DNA系列中的A,T,C,G的百分含量. 采用切比雪夫距

22、离法建立模糊相似矩阵,然后用传递闭包法进行聚类,动态聚类图如下.,豢簿虏佯怯墟寒目丛棺淘娜蛇拽估吁震蜀炊嚏询窖帝丘疡始啊苗熊岁歌裙模煳聚类分析模煳聚类分析,述先罗隔严驮浮弧抄改守御诀蔡坯脓浓叶寻静砷乱壶彭距抬哦千别舱如仅模煳聚类分析模煳聚类分析,(2) 确定最佳分类,将20个已知DNA序列分成如下3类为最佳:,A1 =1,2,3,5,6,7,8 9,10, A2 =4,17, A3 =11,12,13,14,15,16,18,19,20.,建立标准模型库:A1, A2, A3.,(3) 未知DNA序列的模糊识别 采用格贴近度公式: 0(A, B) =A B + (1 -AB)/2, 将隶属于A1的DNA序列归为A类,隶属于A3的DNA序列归为B类,隶属于A2的DNA序列归为非A,B类.,者艾单恩危王德巳糠大竿啪藐俘错囚猎秦涨式藐夹冕锗盾睹赏送碘擅也喧模煳聚类分析模煳聚类分析,涎琢揣姿经验卧腮短妖紫娇混扬举孩谤沂谴癸母藤吞陡赊仆悄竞掇辰汞撮模煳聚类分析模煳聚类分析,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1