模糊C均值聚类程序.doc_三一文库31doc.com

资源描述

《模糊C均值聚类程序.doc》由会员分享，可在线阅读，更多相关《模糊C均值聚类程序.doc（9页珍藏版）》请在三一文库上搜索。

1、实验二模糊C均值聚类实验目的：学会使用MATLAB软件进行模糊C均值聚类，学会如何进行迭代并观察迭代过程。实验学时：4学时实验容：1、认真阅读guide.doc文件，通过给出的英文的例子学习进行 C均值聚类的具体步骤。2、在学习完所给的例子后进行实际操作。根据表格提供的固定资本和人力资本等进行聚类分布。进一步熟悉和掌握熟悉FUZZY CLUSTERING .实验日期：2013年4月24日实验过程：1、查看所给数据表格（如下），由经济学理论知，GDP的产出状况是由固定资本的投入和人力资源的投入决定的。因此，实际上我们只需要选取固定资本和人力资源这两组数据进行处理就行了。地区（Distr

2、ict）GDP固定资本(FixedCapital)人力资本(manpowerCapital)地区（District）GDP固定资本(FixedCapital)人力资本(manpowerCapital)2.05765.94891.36000.78031.38201.0000天津1.83284.03081.39900.60390.91710.66600.82361.62230.86901.36812.72981.02600.54401.03370.7960广西0.46600.83420.54600.65031.10990.93100.68590.81270.62001.20012.03140.38

3、500.56500.81270.62000.75530.31141.02200.51181.04100.56300.93441.42081.28100.28560.57560.29903.06748.03961.74800.48401.01660.46601.29332.24501.08800.52751.35880.52401.46293.10380.89400.50401.03070.57400.51990.81120.61400.41650.85440.45901.23652.05231.15500.57541.5080.55000.51980.74940.78500.53001.503

4、60.51801.04391.65340.9470新疆0.79812.02260.91100.59031.92100.6530平均0.89141.89360.85732 、通过学习guide中的例，将所给的defcm.m程序进行重新编辑。其具体程序如下：function NCentres, M = defcm(Centres, q)Tiles = 5.94891.360014.03081.399012.03140.385011.42081.281018.03961.748012.24501.088013.10380.894012.05231.155011.65340.947012.72981

5、.026011.62230.8690-11.03370.7960-11.10990.9310-10.31141.0220-10.81120.6140-10.74940.7850-11.92100.6530-11.38201.0000-10.91710.6660-10.83420.5460-10.81270.6200-10.81270.6200-11.04100.5630-10.57560.2990-11.01660.4660-11.35880.5240-11.03070.5740-10.85440.4590-11.5080.5500-11.50360.5180-12.02260.9110-1

6、;记为 1 ，%将固定资本和人力资本的数据按GDP勺平均值进行分类，大于平均值的分为一类，小于平均值的分为一类，记为 -1Tiles(:, 1) = log(Tiles(:, 1) ;Tiles(:, 2) = log(Tiles(:, 2) ;clf ; hold off ;plot(Tiles(1:16, 1), Tiles(1:16, 2), ob ) ;axis(-1.5 2.5 -1.5 2.5) ;xlabel( 固定资本 ) ;ylabel( 人力资本 ) ;title( Tiles data: o = whole tiles, * = cracked tiles, x = ce

7、ntres*b ) ;xr ) ;hold on; plot(Tiles(17:31, 1), Tiles(17:31, 2), plot(Centres(:,1), Centres(:,2),Object = Tiles(:,1 2) ;Centres = Centres ;k = length(Centres(:,1);D = dist(Object, Centres);M = member(D, q) ;ClustSums = sum(M) ;NoOfObs, NoOfCtrs = size(M) ;z = M ./ (ones(NoOfObs,1) * ClustSums) ;NCen

8、tres = Centres ;for i = 1:NoOfCtrs,w = z(:,i) * ones(1,2) ;NCentres(i,:) = sum(Object .* w) ; end ;3、将上述程序保存为 defcm.m 文件，然后在命令窗口中输入初始聚类中心Cts = 0.5 0.5; 0.8 0.8，即在这里面我们取了两个聚类中心点， c1=(0.5,0.5)、 c2=(0.8,0.8),并设 q=2。需要注意的是，q越接近1收敛速度越快，但若q=1则为硬C均值聚(HCM ) 然后不断调用函数 defcm, Cts, M = defcm(Cts,q)。即在 Command 窗

9、口中输入：Cts = 0.5 0.5; 0.8 0.8；q = 2；Cts, M = defcm(Cts,q)。本次实验一共迭代了 13 次， M 矩阵才不再变化，达到了最佳聚类中心。迭代的仿真图形如下所示：(迭代时只要将Comma nd窗口中Cts中的值换成前一次迭代输出的值即可)第 1 次迭代仿真的图形545C；5C；5C；5C；r- 55-1木资力人第6次迭代仿真的图像木资力人-1.5-1.5-1-0.51.5Tiles data: o = whole tiles, * = cracked tiles, x = cen tres 2.5255 a5 a-di00.51固定资本22.5第

10、13次的迭代图形:2.5木资力人F面为最终的聚类中心和M矩阵Cts =0.0733 -0.44950.7166 -0.07130.26830.73170.20940.79060.54220.45780.29450.70550.30960.69040.03820.96180.12410.87590.05700.94300.11870.88130.07800.92200.18220.81780.90660.09340.72260.27740.66880.33120.92680.07320.85650.14350.27870.72130.37590.62410.96500.03500.92440.0

11、7560.92740.07260.92740.07260.97700.02300.75010.24990.90480.09520.84260.15740.98180.01820.88650.11350.73170.26830.73870.26130.00120.99884、由于不能确保FCM收敛于一个最优解，所以我们可以采用不同的初始聚类中心启动该算法，以便用来比较结果。在Comma nd窗口中输入：Cts = 0.5 1.0; 1.5 2.0;q = 2;Cts, M = defcm(Cts,q)在这次实验一共迭代了 15次，M矩阵才不再变化，达到了最佳聚类中心。在这里只给出第15次，Co

12、mma nd窗口中显示的聚类中心值 Cts和M矩阵:Cts =0-07&9-0. 4483C.7031-0. 0750Command Wincow0.27590. 72410.21820. 731S0,54050.45050. 2911CL 70800.31590. 6S410. 04490. 5561 1335Q*85650.06180. 93820. 10640. 39360.08740.0. 10EO0. 83500. 9032Q. 09630.71510.23490. 66330. 33670, 92080.07920. 84940. 15090. 27290. 72710.0. 63

13、GO0.96100. 03900.51360.08140.92150,07850,92150,0850. 97450.0.74400. 2560D. S9980” 1103Ol S40L0.15990, 9794Q.02060.39040.1160.72030.27170. 73520.26180,0)05O.999E通过最终的迭代图可以看出：当初始聚类中心取值不同时，最后的聚类中心点的值也有细微的差别。FCM是否收敛于一个最优解，不仅与初始聚类中心的选择有关，还与加权指数q有关。由模糊集的知识我们知道，加权指数q取得过大，聚类效果会很差； q取得过小则算法会接近与HCM聚类算法。所以下面

14、的仿真中，其他数据不变，取:q=1.1,聚类中心为Cts = 0.5 0.5; 0.8 0.8。经过MATLAB仿真后知道，此时只需迭代8次就可达到了最佳聚类中心。F面只给出第八次迭代的相关数据:-0. 0S19-0, 53E70. 916&C. 0554K壬0L 000 03.flDOO0畑J.00040-0.1SB7也畑0. 3 MTO.OMO3.00000. 0MU3.dODO5 OGOOJ. (3000OuOMOOlOOOO3.0000也伽I.OMOCO DOO0. msO.ODOL04 DMI.OMJOCO DOOL OMOa. ODDO0. 0W10-OM34.S93?L OMOC

15、ODDOLooao0.0 DOOL OMO0,0 DOOL OMOCL ODDOL.価Q0 0 DML OMO0.(3 DOOLo.ODoaL OMO0.0 DOOAL OMO04 DM1.00 DC0.0000kCOMo.aoooJ.OOMc.aoncQmwjl.QOQC实验小结：通过这次实验对模糊C均值聚类（FCM）有了近一步的了解，并且结合例子能够进行简单的聚类中心迭代，寻找最佳聚类中心。另外，通过q取不同的值进行了比较，得到了更快更好的聚类中心。通过观察实验结果，明确 FCM算法的输出是C个聚类中心向量和C*N的一个模糊划分矩阵 M，这个矩阵表示的是每个样本点属于每个类的隶属度。根据这个划分矩阵按照模糊集合中的最大隶属原则就能确定每个样本归哪个类。聚类中心表示的是每个类的平均特性，可以认为是这个类的代表点。FCM算法因算法简单、收敛速度快、易于应用计算机实现等特点受到了越来越多人的关注，并应用于各个领域。

展开阅读全文