第6章__方差分析.pdf

上传人:本田雅阁 文档编号:2490118 上传时间:2019-04-03 格式:PDF 页数:59 大小:784.87KB
返回 下载 相关 举报
第6章__方差分析.pdf_第1页
第1页 / 共59页
第6章__方差分析.pdf_第2页
第2页 / 共59页
第6章__方差分析.pdf_第3页
第3页 / 共59页
第6章__方差分析.pdf_第4页
第4页 / 共59页
第6章__方差分析.pdf_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《第6章__方差分析.pdf》由会员分享,可在线阅读,更多相关《第6章__方差分析.pdf(59页珍藏版)》请在三一文库上搜索。

1、第第6章章 方差分析方差分析 Analysis of Variance (ANOVA) 6.1 方差分析简介 6.2 单因素方差分析 6.3 双因素方差分析 Page 2 北京建筑工程学院 学习目标学习目标 掌握方差分析中的基本概念; 掌握方差分析的基本思想和原理; 掌握单因素方差分析的方法及应用; 初步了解多重比较方法的应用; 了解双因素方差分析的方法及应用。 Page 3 北京建筑工程学院 6.1 方差分析中的基本概念和方差分析中的基本概念和 假设假设 日常生活中经常发现,影响一个事 物的因素很多,希望找到影响最显 著的因素 如某种农作物的收获量受作物品种 、肥料种类及数量等的影响;选择

2、不同的品种、肥料种类及数量进行 试验, Page 4 北京建筑工程学院 6.1 方差分析中的基本概念和方差分析中的基本概念和 假设假设 看哪一个影响大?并需要知道起显 著作用的因素在什么时候起最好的 影响作用。 方差分析就是解决这些问题的一种 有效方法。 Page 5 北京建筑工程学院 为什么要进行方差分析? 为了比较四个专业的起薪,我们 从某高校四个专业的毕业生中分 别随机选择6人调查他们的起薪。 如何根据样本数据比较不同专业 毕业生的平均起薪? Page 6 北京建筑工程学院 要研究的问题要研究的问题 总体总体1 1,1 1 (专业专业=1 =1 ) 总体总体2 2,2 2 (专业专业=2

3、=2) 总体总体3 3,3 3 (专业专业=3=3) 样本样本1 1 样本样本2 2 样本样本3 3 样本样本4 4 总体总体4 4,4 4 (专业专业=4=4) 2 11, s x 2 22, s x 2 33, s x 2 44, s x ? 4321 = Page 7 北京建筑工程学院 各个总体的均值相等吗?各个总体的均值相等吗? X f(X) 1 = 2 = 3 = 4 X f(X) 3 1 2 4 Page 8 北京建筑工程学院 研究方法:两样本的研究方法:两样本的t检验?检验? 用t检验比较两个均值: 每次只能比较两个均值,要解决上述问题 需要进行6次t检验 在整体检验中犯第一类错

4、误的概率显著增 加: 如果在每次t检验中犯第一类错误的概率 等于5%,则在整体检验中等于1-(1- 0.05)6=0.2649 Page 9 北京建筑工程学院 方差分析可以用来比较多个均值方差分析可以用来比较多个均值 方差分析(Analysis of variance,ANOVA )的主要目的是通过对方差的比较来检验 多个均值之间差异的显著性。 可以看作t检验的扩展,只比较两个均值时 与t检验等价。 20世纪20年代由英国统计学家费希尔(R. A. Fisher)最早提出的,开始应用于生物 和农业田间试验,以后在许多学科中得到 了广泛应用。 Page 10 北京建筑工程学院 ANOVA 由英国

5、统计 学家R.A.Fisher首创, 为纪念Fisher,以F命 名,故方差分析又称 F 检验 (F test)。用 于推断多个总体均数有 无差异 Page 11 北京建筑工程学院 6.1.1 方差分析中的几个基本概念方差分析中的几个基本概念 因变量:我们实际测量的、作为结果的变 量,例如失业持续时间。 自变量:作为原因的、把观测结果分成几 个组以进行比较的变量例如奖金水平。 在 方 差分 析 中, 自 变量 也 被称 为 因素 (factor)。 因素的不同表现,即每个自变量的不同取 值称为因素的水平。 Page 12 北京建筑工程学院 6.1.1 基本概念基本概念 方差分析主要用来研究一个

6、定量因变量与 一个或多个定性自变量的关系 只有一个自变量的方差分析称为单因素方 差分析。 研究多个因素对因变量的影响的方差分析 称为多因素方差分析,其中最简单的情况 是双因素方差分析。 Page 13 北京建筑工程学院 6.1.1 :固定效应与随机效应模型:固定效应与随机效应模型 固定效应模型:因素的所有水平都是由实 验者审慎安排而不是随机选择的。 随机效应模型:因素的水平是从多个可能 的水平中随机选择的。 固定效应和随机效应模型在假设的设置和 参数估计上有所差异,本章研究的都是固 定效应模型。 Page 14 北京建筑工程学院 6.1.2:方差分析中的基本假设:方差分析中的基本假设 (1)在

7、各个总体中因变量都服从正态分布; (2)在各个总体中因变量的方差都相等; (3)各个观测值之间是相互独立的。 Page 15 北京建筑工程学院 (1)正态性的检验)正态性的检验 各组数据的直方图 峰度系数、偏度系数 Q-Q图, K-S检验* Page 16 北京建筑工程学院 (2)等方差性的检验)等方差性的检验 经验方法:计算各组数据的标准差,如果最大值 与最小值的比例小于2:1,则可认为是同方差的。 最大值和最小值的比例等于1.833.32,p-值=0.0002 ji xx ) 11 ()( 2/ ji ji nn MSEtxx+ Page 36 北京建筑工程学院 实例:热带雨林采伐实例:热

8、带雨林采伐 很多统计软件都可以直接进行多重比较。下表是SPSS 对热带雨林例子的输出结果。 置信区间5.3114.03,3.2612.68不包括0,差异显 著。 置信区间-6.043.02包括了0,差异不显著。 (I) 采伐类型 (J) 采伐类型 均值差 (I-J) 标准 误 p-值 95% 置信区间 下限 上限 从未采伐过 1年前采伐过 9.67 2.14 0.0001 5.31 14.03 8年前采伐过 7.97 2.31 0.0017 3.26 12.68 1年前采伐过 从未采伐过 -9.67 2.14 0.0001 -14.03 -5.31 8年前采伐过 -1.69 2.31 0.46

9、82 -6.40 3.02 8年前采伐过 从未采伐过 -7.97 2.31 0.0017 -12.68 -3.26 1年前采伐过 1.69 2.31 0.4682 -3.02 6.40 Page 37 北京建筑工程学院 6.3 双因素方差分析双因素方差分析 6.3.1 无交互作用的双因素方差分析 6.3.2 有交互作用的双因素方差分析 6.3.3 双因素方差分析的步骤 Page 38 北京建筑工程学院 交互作用交互作用 交互作用即一个因素对因变量的影响程度受另一 个因素的影响的情况。 假设学生分两类:在校和在职。把两类学生随机 分成两组,分别采用课堂讲授和交互式教学方法 ,考试结果如下表。 可

10、见课堂讲授的方式更适合于在校生,交互式教 学方式更适合于在职生。在这种情况下我们说两 个因素之间存在着交互作用。 课堂讲授 交互式教学 在校学生 90 75 在职学生 75 90 Page 39 北京建筑工程学院 双因素方差分析的类型和基本假设双因素方差分析的类型和基本假设 双因素方差分析中因素A和B对结果的影响相互独 立时称为无交互作用的双因素方差分析。 如果除了A和B对结果的单独影响外还存在交互作 用,这时的双因素方差分析称为有交互作用的双 因素方差分析 。 双因素方差分析中的基本假设是各个子总体都服 从正态分布,有相同的方差,并且各个观测值之 间相互独立(与单因素时相同)。 Page 4

11、0 北京建筑工程学院 6.3.1无交互作用的双因素方差分析模型无交互作用的双因素方差分析模型 在无交互作用的双因素方差分析模型中因 变量的取值受四个因素的影响:总体的平 均值;因素A导致的差异;因素B导致的差 异;以及误差项。写成模型的形式就是: ijkiiij X+= Page 41 北京建筑工程学院 6.3.1无交互作用的双因素方差分析模型无交互作用的双因素方差分析模型 离差平方和的分解: SSESSBSSA XXXX XXrmXXsm XXSST r i s j m k jiijk s j j r i i r i s j m k ijk += + += = = = = = 111 2 1

12、 2 1 2 111 2 )( )()( )( SSA SSB SSE SST Page 42 北京建筑工程学院 无交互作用的双因素方差分析表无交互作用的双因素方差分析表 变差 来源 离差平方和 SS 自由度 df 均方 MS F值 A因素 SSA r-1 MSA=SSA/(r-1) FA=MSA/MSE B因素 SSB s-1 MSB=SSB/(s-1) FB=MSB/MSE 误 差 SSE n-r-s+1 MSE=SSE/(n-r- s+1) 合 计 SST n-1 Page 43 北京建筑工程学院 6.3.2 有交互作用的双因素方差分析模型有交互作用的双因素方差分析模型 在有交互作用的双

13、因素方差分析模型中因变量的 取值受五个因素的影响:总体的平均值;因素A 导致的差异;因素B导致的差异;由因素A和因素 B的交互作用导致的差异;以及误差项。写成模 型的形式就是: ijkijiiij X+=)( Page 44 北京建筑工程学院 6.3.2 有交互作用的双因素方差分析模型有交互作用的双因素方差分析模型 离差平方和的分解: SSESSABSSBSSA XX XXXXm XXrmXXsm XXSST r i s j m k ijijk r i s j jiij s j j r i i r i s j m k ijk += + + += = = = = = = 111 2 11 2 1

14、 2 1 2 111 2 )( )( )()( )( SST SSA SSB SSE SSAB Page 45 北京建筑工程学院 有交互作用的双因素方差分析表有交互作用的双因素方差分析表 变异来 源 离差平 方和SS 自由度 df 均方 MS F值 A因素 SSA r-1 MSA=SSA/(r-1) FA=MSA/MSE B因素 SSB s-1 MSB=SSB/(s-1) FB=MSB/MSE AB交 互作用 SSAB (r-1)(s-1) MSAB=SSAB/(r- 1)(s-1) FAB=MSAB/MSE 误 差 SSE rs(m-1) MSE=SSE/rs(m-1) 合 计 SST n-

15、1 Page 46 北京建筑工程学院 6.3.3 双因素方差分析的步骤(双因素方差分析的步骤(1) 双因素方差分析的步骤与单因素分析类似, 主要包括以下步骤: 1.分析所研究数据能否满足方差分析要求的 假设条件,需要的话进行必要的检验。如果 假设条件不满足需要先对数据进行变换。 Page 47 北京建筑工程学院 6.3.3 双因素方差分析的步骤(双因素方差分析的步骤(2) 2、提出零假设和备择假设。双因素方差分析可以同时检验 两组或三组零假设和备择假设。 要说明因素A有无显著影响,就是检验如下假设: 要说明因素B有无显著影响,就是检验如下假设: 在有交互作用的双因素方差中,要说明两个因素的交互

16、 作用是否显著还要检验第三组零假设和备择假设: 0: 210 = r H 0: 211 不全为, r H 0: 210 = s H0: 211 不全为, s H 0)()( : rs12110 =H0)()()( : rs12111 不全为,H Page 48 北京建筑工程学院 6.3.3 双因素方差分析的步骤(双因素方差分析的步骤(3) 3、计算F检验值。 4、根据实际值与临界值的比较,或者p- 值与的比较得出检验结论。 与单因素方差分析的情况类似,对FA 、FB和FAB,当F的计算值大于临界值 F(或者p-值)时 拒绝零假设H0。 Page 49 北京建筑工程学院 双因素方差分析:起薪的例

17、子(双因素方差分析:起薪的例子(1) 同时考虑专 业和性别因 素,二者对 起薪有显著 影响吗? (假设无交 互作用) 序号序号 专业专业 性别性别 起薪(元)起薪(元) 1 1 0 3000 2 1 0 3100 3 1 0 3300 4 1 1 4000 5 1 1 3700 6 1 1 3500 7 2 0 3500 Page 50 北京建筑工程学院 双因素方差分析:起薪的例子(双因素方差分析:起薪的例子(2) 1、同时考虑两个因素时,每种实验条件下的数据 只有3个,不适合直接进行正态性和等方差性检验 。假设这些条件成立。 2、提出假设(有交互作用的方差分析模型 ): 对专业因素: 对性别

18、因素: 0: 43210 =H 0: 43211 不全为,H 0: 210 =H0: 211 不全为,H Page 51 北京建筑工程学院 双因素方差分析:起薪的例子(双因素方差分析:起薪的例子(3) 在SPSS菜单中选择“分析”“一般线性 模型”“单变量”,经过相应的设定后 输出的方差分析表 。 源 III 型平方和 df 均方 F Sig. 校正模型 7528333 4 1882083.33 17.52 0.0000 截距 216600417 1 216600416.67 2016.12 0.0000 专业 4927917 3 1642638.89 15.29 0.0000 性别 2600

19、417 1 2600416.67 24.20 0.0001 误 差 2041250 19 107434.21 总计 226170000 24 校正的总计 9569583 23 Page 52 北京建筑工程学院 双因素方差分析:起薪的例子(双因素方差分析:起薪的例子(4) 由于专业变量对应的p值(Sig.一栏)为 0.0000,说明在考虑了性别因素以后各专 业之间的平均起薪差异仍然是显著的。 从性别对起薪的影响看,该变量对应的p值 为0.0001,小于通常使用的a值,说明平均 起薪的性别差异也是显著的。 Page 53 北京建筑工程学院 双因素方差分析:失业保险的例子(双因素方差分析:失业保险的

20、例子(1) 年龄组 1 2 3 92 88 94 奖 1 100 89 80 85 90 78 86 88 78 金 2 108 89 72 93 75 79 96 77 82 水 3 92 79 75 90 71 81 78 87 82 平 4 75 73 68 76 83 72 同时考虑奖 金和年龄因 素,二者对 失业时间有 显著影响吗? Page 54 北京建筑工程学院 双因素方差分析:失业保险的例子(双因素方差分析:失业保险的例子(2) 1、同时考虑奖金水平和年龄因素时,每种实验条件下的 数据只有3个,不适合直接进行正态性和等方差性检验。 假设这些条件成立。 2、提出假设(有交互作用的

21、方差分析模型 ): 对奖金因素: 对年龄因素: 对交互作用: 0: 43210 =H 0: 43211 不全为,H 0: 3210 =H0: 3211 不全为,H 0)()( : 4312110 =H0)()()( : 4312111 不全为,H Page 55 北京建筑工程学院 双因素方差分析:失业保险的例子(双因素方差分析:失业保险的例子(3) 源 III 型平方和 df 均方 F Sig. 校正模型 1856 11 168.69 4.20 0.0016 截距 250167 1 250166.69 6223.91 0.0000 奖金 625 3 208.32 5.18 0.0067 年龄

22、720 2 360.11 8.96 0.0012 奖金 * 年龄 510 6 85.07 2.12 0.0887 误差 965 24 40.19 总计 252987 36 校正的总计 2820 35 Page 56 北京建筑工程学院 双因素方差分析:失业保险的例子(双因素方差分析:失业保险的例子(4) 4、结论: 在5%的显著性水平下奖金水平对就业时 间影响显著; 年龄对就业时间有显著影响; 奖金水平与年龄的交互作用的影响不显著 Page 57 北京建筑工程学院 小结小结 (1) 1、方差分析(ANOVA),一般用来分析一个 定量因变量与一个或几个定性自变量(因素) 之间的关系,它可以对多个总

23、体的均值是否相 等进行整体检验。 2、根据研究所涉及的因素的多少,方差分析 可分为单因素方差分析和多因素方差分析(包 括双因素方差分析)。 3、方差分析中的基本假设是,来自各个总体 的数据都服从正态分布,相互独立,且有相同 的方差。 Page 58 北京建筑工程学院 小结小结 (2) 4、方差分析的基本思想是,将观察值之间的 总变差分解为由所研究的因素引起的变差和 由随机误差项引起的变差,通过对这两类变 差的比较做出接受或拒绝原假设的判断的。 5、方差分析的主要步骤包括:建立假设;计 算F检验值;根据实际值与临界值的比较做出 决策。 6、在方差分析中,当拒绝H0时表示至少有两 个均值有显著差异。但要知道哪些均值之间 有显著差异还需要借助于多重比较的方法, 例如LSD方法。 Page 59 北京建筑工程学院

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1