多元统计分析的重点和内容和方法.pdf

资源描述

《多元统计分析的重点和内容和方法.pdf》由会员分享，可在线阅读，更多相关《多元统计分析的重点和内容和方法.pdf（10页珍藏版）》请在三一文库上搜索。

1、1 / 10 一、什么是多元统计分析多元统计分析是运用数理统计的方法来研究多变量，再用适当的统计方法确定假设成立的可能性大小，如可能性小,则认为假设不成立；反之，则认为假设成立。b5E2RGbCAP 2、假设检验的步骤 2 或 10 或 d查 t 界值表，若P=，则还不能拒绝H0。例 4：要比较50 个人在减肥前和减肥后的重量。这样就有了两个样本，每个都有50 个数目。这里不能用前面的独立样本均值差的检验；这是因为两个样本并不独立。每一个人减肥后的重量都和自己减肥前的重量有关。但不同人之间却是独立的。令减肥前的重量均值为 1 ，而减肥后的均值为2 ；这样所要进行的检验为：dvzf

2、vkwMI1 H0 ： 12 H1 ： 1 大于 2 一、方差分析的基本思想 1、定义方差分析又称变异数分析或F 检验，其目的是推断两组或多组资料的总体均数是否相同，检验两个或多个样本均数的差异是否有统计学意义。rqyn14ZNXI 4 / 10 2、了解方差分析中几个重要概念：时,我们称可控制的实验条件为因素(Factor, 因素变化的各个等级为水平(Level。EmxvxOtOco 影响农作物产量的因素，如品种、施肥量、土壤等。如果在实验中只有一个因素在变化,其他可控制的条件不变,称它为单因素实验。若实验中变化的因素有两个或两个以上,则称为双因素或多因素实验。方差分析就是从观测

3、变量的方差入手，研究诸多控制变量是根据 “ 物以类聚 ” 的道理，对样品或指标进行分类的一种多元统计分析方法。将个体或对象分类，使得同一类中的对象之间的相似性比与其他类的对象的相似性更强。聚类分析的目的(P54 使类内对象的同质性最大化和类间对象的异质性最大化。二、聚类分析的基本思想：是根据一批样品的多个观测指标，具体地找出一些能够度量样品或指标之间相似程度的统计量，然后利用统计量将样品或指标进行归类。把相似的样品或指标归为一类，把不相似的归为其他类。直到把所有的样品明氏距离有三种特殊形式：欧氏距离 (Euclidean distance: 当 q=2 时切比雪夫距离当各变

4、量的单位不同或测量值范围相差很大时，不应直接采用明氏距离，而应先对各变量的数据作标准化处理，然后用标准化后的数据计算距离。常用的标准化处理：lzq7IGf02E 其中为第 j 个变量的样本均值；为第 j 个变量的样本方差。 6 / 10 G 的直径 d12=(7.9-7.68+(39.77-50.37 2+(8.49-11.352+(12.94-13.32+(19.27-19.252+(11.05-14.592+(2.04-2.752+(13.29- 14.87 20.5=11.67NrpoJac3v1 d13=13.80 d14=13.12 d15=12.80 d23=24.63 d24

5、=24.06 d25=23.54 d34=2.2 d35=3.51 d45=2.211nowfTG4KI 1 2 3 4 5 D1= 1 0 河南与甘肃的距离最近， 2 11.67 0 先将二者个总体的条件概率P,n=1,2 k. 比较 k 个概率的大小，将样本判归为来自出现概率最大的总体 AVktR43bpw 例：设先验概率、误判损失及概率密度如下：试用贝叶斯判别法将样本x0 判到 G1、G2、G3 中的一个。考虑与不考虑误判损失的结果如何？ 1、考虑误判损失：误判到 G1 的平均损失为 ECM1 0.55*0.46*0+0.15*1.5*400+

6、0.30*0.70*100 误判到 G2 的平均损失为 ECM2 0.55*0.46*20+0.15*1.5*0+0.30*0.70*50 误判到 G3 的平均损失为 ECM3 0.55*0.46*80+0.15*1.5*200+0.30*0.70*0 其中 ECM2 最小，故将x0 判别到 G2。 2、不考虑误判损失：将 x0 判别到 G1 的条件概率为： P =(0.55*0.46/(0.55*0.46+0.15*1.5+0.30*0.70=ORjBnOwcEd 将 x0 判别到 G2 的条件概率为： 9 / 10 P =(0.15*1.5/(0.55*0.46+0.15*1.5+0.3

7、0*0.70=2MiJTy0dTT 将 x0 判别到 G3 的条件概率为： P =(0.30*0.70/(0.55*0.46+0.15*1.5+0.30*0.70=gIiSpiue7A 其中 P 取值最大，故将x0 判别到 G1。主成分分析的重点 1、掌握什么是主成分分析？ 2、理解主成分分析的基本思想和几何意义？ 3、理解主成分求解方法：协方差矩阵与相关系数矩阵的差异？ 4、掌握运用SPSS或 SAS 软件求解主成分 5、对软件输出结果进行正确分析主成分分析：将原来较多的指标简化为少数几个新的综合指标的多元统计方法。主成分：由原始指标综合形成的几个新指标。依据主成分所含信息量的大小成为

8、第一主成分，第二主成分等等。主成分分析得到的主成分与原始变量之间的关系： 1、主成分保留了原始变量绝大多数信息。 2、主成分的个数大大少于原始变量的数目。 3、各个主成分之间互不相关。 4、每个主成分都是原始变量的线性组合。满足如下的条件： 1、每个主成分的系数平方和为1。即 2、主成分之间相互独立，即无重叠的信息。即 3、主成分的方差依次递减，重要性依次递减，即 F1 根据旋转变换的公式：旋转变换的目的：为了使得n个样品点在Fl 轴方向上的离散程度最大，即Fl 的方差最大。总体主成分的求解及其性质矩阵知识回顾：平方 +(0.341 平方 =0.9193cdXwckm15 因子负荷量或称因子载荷）-是指因子结构中原始变量与因子分析时抽取出的公共因子的相关程度。

展开阅读全文