主成分分析在选拔竞赛队员中的应用.doc

上传人:scccc 文档编号:14134268 上传时间:2022-02-02 格式:DOC 页数:9 大小:194.50KB
返回 下载 相关 举报
主成分分析在选拔竞赛队员中的应用.doc_第1页
第1页 / 共9页
主成分分析在选拔竞赛队员中的应用.doc_第2页
第2页 / 共9页
主成分分析在选拔竞赛队员中的应用.doc_第3页
第3页 / 共9页
主成分分析在选拔竞赛队员中的应用.doc_第4页
第4页 / 共9页
主成分分析在选拔竞赛队员中的应用.doc_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《主成分分析在选拔竞赛队员中的应用.doc》由会员分享,可在线阅读,更多相关《主成分分析在选拔竞赛队员中的应用.doc(9页珍藏版)》请在三一文库上搜索。

1、主成分分析在选拔竞赛队员中的应用朱宁摘 要 利用主成分分析方法选拔竞赛队员组成参赛队,通过对相关数 据的处理,寻找关键的综合指标,并以此建立一种加权逐步判别规则, 从而获得选拔参赛队员的数学模型。通过对近年来在全国大学生数学建 模竞赛中取得较好成绩的参赛队员的平时学习成绩进行了分析,找到了 几个关键的综合指标,以此建立数学模型。并对未获奖队员的平时学习 成绩进行了比较,模型是有效的和具有推广价值的。关 键 词 数学建模 ; 主成分分析;逐步判别规则 中图分类法 O212.4The Application of Principal ComponentAnalysis in the Mathema

2、tical ModelingZhu NingDept. of Basic CoursesAbstract The scores of the students who made remarkable achievement in the national college students mathematical modeling competition recently are analyzed by means of principal component analysis.Some critical synthesized indexes are obtained and a stepw

3、ise discrimination rule is established.Finallya fixedquantitative method to select the team members in the future is proposed.Key words mathematical model,princicpal component analysis,stepwise discrimination rule引言一年一度的全国大学生数学建模竞赛已被国家教委定为全国大学生 四大竞赛之一。各参赛院校每年都要为此选拔优秀学生参加这一赛事。 能否合理选拔参赛队员,显然能否取得好的成绩是重

4、要因素,那么,怎 样才能有效地选拔参赛队员呢 ?一般地,竞赛成绩的好坏应与参赛队员平时的学习成绩有关。把参 赛并取得好成绩的全体队员看成是一个总体,合理地选拔参赛队员可归 结为:判别新样品 (即被选拔的队员 ) 是否属于该总体。由于参赛队员的 素质受多种因素影响, 加之竞赛成绩的好坏除了与平时学习成绩有关外, 参赛队内队员之间的默契配合也是至关重要的。为此,采用主成分分析和给定加权判别函数及逐步判别规则,建立数学模型。从而给出了一种 解决这类问题的定量方法。1 建立模型1. 1简化假设假设1把参赛并取得好成绩的全体队员看成是K维总体F中的一个元素,X=(x1j,x kj) (j=1,n)来自总

5、体 F的K维随机向量。X1j表示 “第j个参赛队员的第i个指标”(i=1,k,j=1,n).假设2对X F, X的均值向量为E(X)=U,协差阵为V(X)=V, V的 特征根为入i (i=1,k).假设3每个参赛队均由三人组成。1.2 建立数学模型(1) 主成分分析是把原来多个指标化为少数几个互不相关的综合指 标的一种多元统计方法。它可以达到数据简化、揭示变量之间的内在关 系、以及进行统计解释的目的,为进一步分析总体的性质和数据的统计 特性提供重要的信息| 。(2) 设X的线性函数Y=a X,使得Y的方差尽可能地大,且a a =I,即根据文献2知:maxV(a/X) =maxa,1) nrix

6、 aIVA=r暫I y . r 12) AlA无AAt九*為*0其中 r=rk(V).(3) 所求数学模型为Z 时 xeG 当p(x其中G为“备选队员的全体”组成的集合,且设G内元素的个数为S(S为不小于3的正整数)。(2) 令R为“第j个备选队员的第i个主成分的取值” (i=1,m;j=1,s).1) 若汽厂际川/(其中可作为X G)则备选队员Xki可作为 参赛队的首选对象,K kKS且.2) 若.f 八-八,j 工k1 P2j(Xj),P2ki(如果 G中存在这样的X)备选队员Xk2可作为参赛队的次选对象,K k2S且klM k2.3) 若匚 -二,.,ki,j 工 k2 p3j(Xj),

7、P3k1,p 3k2(如果G中存在这样X的话),选队员X3可作为参赛队的三选对 象,K k3S 且 k3工 k1,k2.4) 用以上方法还可以选出其他参赛队员。5) 如果上式中的P2k2,p 3k3找不到,可增加G中的元素。2模型求解2.1 数据处理(1) 对X F,取k=9, xij(i=1,5)分别表示“第j个队员第i学 期考试科目的平均成绩”、X6j表示“第j个队员高等数学平均成绩”、X7j表示“第j个队员线性代数、概率论与数理统计科目平均成绩”、 X8j 表示“第j个队员计算机相关科目平均成绩”、X9j表示“第j个队员英 语科目平均成绩”。(2) 我们收集了 1994年至1997年间我

8、院数学建模竞赛取得较好成绩(一个全国一等奖、两个全国二等奖、两个区二等奖和两个区三等奖)的参队员的相应学习成绩。(见表1)表1平时学习成绩序号1 *X2X3X4X5X6X7X8X9183.0 89.781.786.082.789.095.086.783.5281.3 81.790.086.572.7 86.580.080.076.0390.789.793.787.589.396.080.084.081.5486.0 89.790.089.587.094.595.0 82.879.5581.7 90.393.090.590.589.595.088.584.5686.0 85.787.090.58

9、4.8 92.595.082.978.5782.781.790.080.291.0 84.090.081.881.5884.0 85.767.082.290.093.590.0 85.377.0981.3 79.794.089.088.0 :89.085.080.771.01080.0 88.782.091.592.3 94.585.085.873.01186.084.092.092.087.0 93.580.084.274.01284.589.382.575.081.5 :93.095.076.277.51378.7 82.890.092.084.088.595.090.075.31486.

10、3 88.293.591.587.5 193.595.084.879.81586.587.089.588.090.3 193.585.082.0 86.01683.389.783.081.084.096.090.077.876.01779.563.067.062.089.574.095.083.369.01867.076.085.069.086.3 171.585.084.069.51986.078.391.586.585.084.090.078.582.02087.083.397.090.581.794.095.086.878,02178.3 68.3 88.580.0 85.772.5 8

11、5.0 84.872.5注:数据来自本院教务科(3)为了使数据具有可比性,将原始数据进行了标准化处理,利用SAS软件包对已获得的21个样品经计算后得:相关矩阵(见表2)、主成 分及贡献率(见表3)、主成分的载荷(见表4)及Z值:Z=-4.28.表2相关矩阵X1X2X3X4X5X6X7X8X9X11.0000 ().4999 ().26620.53260.02580.74550.0851 -0.16730.6215X20.4999 1.0000 ().28280.60960.00840.86840.11120.02390.6227X30.2662 0).2828.00000.6454-1.777

12、0.2450-0.19230.05580.3394X40.5326 0).6096 ().64541.0000-0.3050.6763-0.6600.29230.4768X50.0258 0).0084-0.17777-0.0351.00000.03400.01060.28240.0691X60.7455 0).8684 ().24500.67630.03401.00000.0926-0.2670.4878X70.0851 0).1112 -0.923-0.6600.01060.09261.00000.19210.319X8-0.16730.0239 0.05580.29230.2824-0.

13、2670.19211.00000.0353X9 0.6215 0.6227 0.33940.4768 0.0691 0.4875 0.2319 0.0353 1.0000表3前四个主成分及贡献率主成分特征值贡献率累计贡献率P13.710700.4123000.41230P21.422500.1580550.57035P31.258440.1398260.71018P40.96337 0.1070410.81722表4前四个主成分载荷矩阵P1P2P3P4X10.41-0.05-0.27-0.17X20.440.06-0.12-0.04X30.28-0.340.490.21X40.43-0.050

14、.380.07X50.000.550.13-0.68X60.460.02-0.17-0.16X70.050.51-0.370.62X80.040.550.570.22X90.39 0.13-0.140.092.2 模型结果分析2.2.1 主成分及其变量的关系P1=0.41x 计0.44x 2+0.28x 3+0.43x 4+0.46x 6+0.05x 汁0.04x 8+0.39x 9 .P2=-0.05x 1+0.06x2-0.34x 3-0.05x 4+0.55x5+0.02x6+0.51x7+0.55x8+0.13x9 .Pa=-0.27x 1-0.12x 2+0.49x3+0.38x4+

15、0.13x5-0.17x 6-0.37x 7+0.57x8-0.14x 9 .P4=-0.17x 1-0.04x 2+0.21x3+0.07x4-0.68x 5-0.16x 6+0.62x7+0.22x8+0.09x9 .2.2.2 主成分载荷分析(1) 在第一主成分中变量X1,X2,X 4,X6,X9都有较高的正载荷。这说明在 竞赛中取得好成绩的队员在学习上能全面发现, 所以P可以看成是“综合 学习成绩”指标。P2(2) 在第二主成分中变量X5,x 7,X8都有较高的正载荷。这说明竞赛成 绩与参赛队员在被选拔前的状态以及工程数学和计算机能力有关,所以可以看成是“动手能力”指标。(3) 在第三

16、主成分中变量X3,X4,X8均有较高的正载荷。这说明竞赛成 绩与参赛队员平时学习情况有关,P3可以看成是“学习稳定”指标。(4) 在第四主成分中X7有较高的正载荷。这说明竞赛成绩与参赛队员 应用数学的能力有关,所以P4可以看成是“数学应用的能力”指标。2.3 模型检验(1)我们收集了参加过竞赛,但未取得好成绩的队员的平时学习成绩, 计算了他们各自的前四项主成分的值见表5.表5参赛队的前四个主成分向量P iP1P2P3P4)/队口. 号主成份向量值12.08,2.12,2.231.25,1.26,1.150.33,0.44,0.460.13,0.18,0.0922.32,2.12,2.131.2

17、6,1.19,1.150.46,0.40,0.390.17,0.21,0.19 32.08,2.20,1.861.24,1.21,1.200.40,0.45,0.320.15,0.16,0.1042.00,2.15,2.091.22,1.19,1.130.48.0.39,0.320.19,0.23,0.17152.15,1.99,1.931.21,1.23,1.080.30,0.32,0.220.11,0.11,0.221 (2)从表5中可以看出,以往凭经验定性选拔参赛队员在配对上存 在明显问题,特别是2号参赛队,其中有一成员平时成绩一直很好,我 们也对该队抱有很大希望,但事与愿违。从这些参赛

18、队中看出他们共同 的不足是配对不够合理,特长不能互补。3结束语本模型通过对参赛并取得较好成绩的队员的平时成绩进行了分析 后,找到了四个重要的综合指标:“综合学习成绩”、“动手能力”、“学习稳定性”和“数学应用能力”。这与以往初选队员时的想法及实 践经验基本吻合,从中看出平时的数学成绩对数学建模竞赛成绩的影响 不是最重要的。以过去经验,选拔后的队员一般还要进行综合训练,所 以最终确定参赛队员应是定性挑选与以上定量选拔相结合。由于该模型原始样本还不够多,随着今后样本的不断增加,将变的更加合理,除可 作为选拔数学建模参赛队员外,也可作为选拔由多人组队参加的其它竞 赛项目,如电子科技大赛等。致谢 本文在写作过程中曾得到陈克西教授的指点、帮助,特此致谢 !第一作者 男 42 岁 讲师 桂林 150001作者单位:桂林电子工业学院 基础部参考文献1吴翊等应用数理统计 湖南:国防科技大学出版社, 1995:285-286 2张尧庭,方开泰多元统计分析引论 北京:科学出版社, 1982: 322-3253 方开泰 实用多元统计分析 上海:华东师范大学出版社, 1989:2944 王黎明主成分分析在评价老年心脑血管功能状态中的应用应用概率统计, 1996,(4)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1