对数线性模型.doc

上传人:3d66 文档编号:905815 上传时间:2018-12-03 格式:DOC 页数:17 大小:135.50KB
返回 下载 相关 举报
对数线性模型.doc_第1页
第1页 / 共17页
对数线性模型.doc_第2页
第2页 / 共17页
对数线性模型.doc_第3页
第3页 / 共17页
亲,该文档总共17页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《对数线性模型.doc》由会员分享,可在线阅读,更多相关《对数线性模型.doc(17页珍藏版)》请在三一文库上搜索。

1、对数线性模型第一节 General过程9.1.1 主要功能9.1.2 实例操作第二节 Hierarchical过程9.2.1 主要功能9.2.2 实例操作第三节 Logit过程9.3.1 主要功能9.3.2 实例操作对数线性模型是用于离散型数据或整理成列联表格式的计数资料的统计分析工具。在对数线性模型中,所有用作的分类的因素均为独立变量,列联表各单元中的例数为应变量。对于列联表资料,通常作2 检验,但2 检验无法系统地评价变量间的联系,也无法估计变量间相互作用的大小,而对数线性模型是处理这些问题的最佳方法。第一节 General过程9.1.1 主要功能调用该过程可对一个或多个二维列联表资料进行

2、非层次对数线性分析。它只能拟合全饱和模型,即分类变量各自效应及其相互间效应均包含在对数线性模型中。返回目录 返回全书目录9.1.2 实例操作 例9-1在住院病人中,研究其受教育程度与对保健服务满意程度的关系,资料整理成列联表后如下所示。对保健服务满意程度(%)受教育程度高中低满意不满意65 (91.5)6 (8.5)272 (93.8)18 (6.2)41 (97.6)1 (2.4)按一般情形作2检验,结果显示不同受教育程度的住院病人其对保健服务满意程度无差别。但从百分比分析中可见,随受教育程度的提高,满意程度有下降的趋势;且我们还想了解受教育程度与满意程度有无交互作用和交互作用的大小。对此,

3、必须采用对数线性模型加以分析。9.1.2.1 数据准备激活数据管理窗口,定义变量名:实际观察频数的变量名为freq,受教育程度和满意程度作为行、列分类变量(即独立变量),变量名分别为educ、care。输入原始数据,结果如图9.1所示。如同第四章Crosstab过程中所述,为使列联表的频数有效,应选Data菜单的Weight Cases.项,弹出Weight Cases对话框(图9.2),激活Weight cases by项,从变量列表中选freq点击钮使之进入Frequency Variable框,点击OK钮即可。图9.1 原始数据的输入图9.2 频数的加权定义9.1.2.2 统计分析激活S

4、tatistics菜单选Loglinear中的General.项,弹出General Loglinear Analysis对话框(图9.3)。从对话框左侧的变量列表中选care,点击钮使之进入Factor(s)框,点击Define Range.钮,弹出General Loglinear Analysis: Define Range对话框,定义分类变量care的范围,本例为1、2,故可在Minimum处键入1,在Maximum处键入2,点击Continue钮返回General Loglinear Analysis对话框。同法将变量educ选入Factor(s)框,并定义其范围为1、3。本例要求计

5、算各分类变量主效应和交互作用的参数估计,故点击Contrast.钮,弹出General Loglinear Analysis:Contrasts对话框,选择Display parameter estimates项,点击Continue钮返回General Loglinear Analysis对话框,最后点击OK钮即完成分析。图9.3 非层次对数线性模型分析对话框9.1.2.3 结果解释在结果输出窗口中将看到如下统计数据:首先显示系统对403例资料进行分析,共有二个分类变量:CARE为2水平,EDUC为3水平。分析的效应有三类:满意程度(CARE)、教育程度(EDUC)和两者的交互作用(CARE

6、 BY EDUC)。系统经2次叠代后即达到相邻二次估计之差不大于规定的0.001。DATA Information 6 unweighted cases accepted. 0 cases rejected because of out-of-range factor values. 0 cases rejected because of missing data. 403 weighted cases will be used in the analysis.FACTOR Information Factor Level Label CARE 2 EDUC 3DESIGN Informati

7、on 1 Design/Model will be processed.Correspondence Between Effects and Columns of Design/Model 1 Starting Ending Column Column Effect Name 1 1 CARE 2 3 EDUC 4 5 CARE BY EDUCNote: for saturated models .500 has been added to all observed cells. This value may be changed by using the CRITERIA = DELTA s

8、ubcommand.* ML converged at iteration 2.Maximum difference between successive iterations = .00000由于本例对Model(模型)未作定义,故系统采用默认的全饱和模型,因而期望例数(EXP.count)与实际例数(OBS. count)相同,进而残差(Residual)、标准化残差(Std.Resid)和校正残差(Adj.Resid)均为0。Observed, Expected Frequencies and ResidualsFactor Code OBS. count & PCT. EXP. cou

9、nt & PCT. Residual Std. Resid. Adj. Resid.CARE 1 EDUC 1 65.50 (16.13) 65.50 (16.13) .0000 .0000 .0000 EDUC 2 272.50 (67.12) 272.50 (67.12) .0000 .0000 .0000 EDUC 3 41.50 (10.22) 41.50 (10.22) .0000 .0000 .0000CARE 2 EDUC 1 6.50 ( 1.60) 6.50 ( 1.60) .0000 .0000 .0000 EDUC 2 18.50 ( 4.56) 18.50 ( 4.56

10、) .0000 .0000 .0000 EDUC 3 1.50 ( .37) 1.50 ( .37) .0000 .0000 .0000最后输出参数估计的结果。为了唯一地估计参数,系统强行限定同一分类变量的各水平参数之和为0,故根据下列结果可推得各参数为:满意 = 1.386724028不满意 = -1.386724028高教育程度 = -0.091477207中教育程度 = 1.144301306低教育程度 = -1.052824099满意.高教育程度 = -0.231600045满意.中高教育程度 = -0.041790087满意.低教育程度 = 0.273390132不满意.高教育程度

11、= 0.231600045不满意.中教育程度 = 0.041790087不满意.低教育程度 = -0.273390132值为正,表示正效应;反之为负效应;零为无效应。分析提供的信息是:对保健服务的满意程度高于不满意程度;中等教育程度者的满意程度高等教育程度者的满意程度低等教育程度者的满意程度;通过受教育程度与对保健服务满意程度的交互作用研究,结果表明高、中等教育未能增加人们对现有保健服务状况的满意程度。Estimates for Parameters CARE Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI 1 1.3867

12、24028 .15965 8.68589 1.07381 1.69964 EDUC Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI 2 -.091477207 .19895 -.45980 -.48142 .29847 3 1.144301306 .17407 6.57393 .80313 1.48547 CARE BY EDUC Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI 4 -.231600045 .19895 -1.16410 -.62154 .

13、15834 5 -.041790087 .17407 -.24008 -.38296 .29938返回目录 返回全书目录第二节 Hierarchical过程9.2.1 主要功能调用该过程可对多维列联表资料进行分层对数线性分析。所谓分层即并可根据用户指定的条件,对某一或某些主效应与交互作用进行剔除,从而形成包含特定层次阶项的各种模型。返回目录 返回全书目录9.2.2 实例操作例9-2 为了研究Colles骨折在不同性别中的年龄分布情况,以说明不同性别者骨折的年龄差异及其年度变化,某地收集了1978-1981年的骨折资料,数据见下表。请作对数线性模型的分析。年龄1978197919801981男女

14、男女男女男女01920-5960-8955165501726094431012992331158910456202029514013754412781539.2.2.1 数据准备激活数据管理窗口,定义变量名:实际观察频数的变量名为freq,年份、性别和年龄为分类变量,变量名分别为year、sex和age。输入原始数据,其中年份1978至1981依次为1、2、3、4,性别男为1、女为2,年龄分组依次为1、2、3。之后选Data菜单的Weight Cases.项,在Weight Cases对话框中激活Weight cases by项,从变量列表中选freq点击钮使之进入Frequency Vari

15、able框,点击OK钮完成对频数的权重定义。9.2.2.2 统计分析激活Statistics菜单选Loglinear中的Hierarchical.项,弹出Hierarchical Loglinear Analysis对话框(图9.4)。从对话框左侧的变量列表中选age,点击钮使之进入Factor(s)框,点击Define Range.钮,弹出Hierarchical Loglinear Analysis: Define Range对话框,定义分类变量age的范围,在Minimum处键入1,在Maximum处键入9,点击Continue钮返回Hierarchical Loglinear Anal

16、ysis对话框。同法将变量sex选入Factor(s)框,定义其范围为1、2;将变量year选入Factor(s)框,定义其范围为1、4。图9.4 层次对数线性模型分析对话框为了更好地拟合数据,并尽可能的简单和易于解释,本例选择向后剔除法建立模型,即从所有效应均在模型中开始,然后消除那些不满足保留判据的效应。点击Model.钮,弹出Hierarchical Loglinear Analysis: Model对话框,在Model Building栏中选Use backward elimination项,点击Continue钮返回Hierarchical Loglinear Analysis对话框

17、。本例要求作参数估计,故点击Options.钮,弹出Hierarchical Loglinear Analysis: Options对话框,在Display for Saturated Model栏中选Parameter estimates项,点击Continue钮返回Hierarchical Loglinear Analysis对话框,之后点击OK钮即完成分析。9.2.2.3 结果解释在结果输出窗口中将看到如下统计数据:首先显示,共有2540个观察例数进入分析,其中分类变量AGE为3水平,SEX为2水平,YEAR为4水平。采用全饱和模型,高阶项为年龄、性别和年份三者的交互作用。(在层次对数线

18、性模型分析中,当指定高阶项时,即意味着包含其所属变量所有可能组合的低阶项;如本例,即包含年龄和性别的交互作用、年龄和年份的交互作用、性别和年份的交互作用、年龄的主效应、性别的主效应、年份的主效应。从最高阶到最低阶共为3阶。)DATA Information 24 unweighted cases accepted. 0 cases rejected because of out-of-range factor values. 3 cases rejected because of missing data. 2540 weighted cases will be used in the ana

19、lysis.FACTOR Information Factor Level Label AGE 3 SEX 2 YEAR 4DESIGN 1 has generating class AGE*SEX*YEARNote: For saturated models .500 has been added to all observed cells.This value may be changed by using the CRITERIA = DELTA subcommand.The Iterative Proportional Fit algorithm converged at iterat

20、ion 1.The maximum difference between observed and fitted marginal totals is .000and the convergence criterion is .278系统以全饱和模型为起始,故显示各变量的实际例数、期望例数、残差和标准化残差,因期望例数与实际例数相同,进而残差、标准化残差均为0。Observed, Expected Frequencies and Residuals.Factor Code OBS count EXP count Residual Std ResidAGE 1 SEX 1 YEAR 1 55.5

21、 55.5 .00 .00 YEAR 2 43.5 43.5 .00 .00 YEAR 3 89.5 89.5 .00 .00 YEAR 4 140.5 140.5 .00 .00 SEX 2 YEAR 1 17.5 17.5 .00 .00 YEAR 2 9.5 9.5 .00 .00 YEAR 3 20.5 20.5 .00 .00 YEAR 4 41.5 41.5 .00 .00AGE 2 SEX 1 YEAR 1 165.5 165.5 .00 .00 YEAR 2 101.5 101.5 .00 .00 YEAR 3 104.5 104.5 .00 .00 YEAR 4 137.5

22、137.5 .00 .00 SEX 2 YEAR 1 260.5 260.5 .00 .00 YEAR 2 233.5 233.5 .00 .00 YEAR 3 202.5 202.5 .00 .00 YEAR 4 278.5 278.5 .00 .00AGE 3 SEX 1 YEAR 1 50.5 50.5 .00 .00 YEAR 2 29.5 29.5 .00 .00 YEAR 3 56.5 56.5 .00 .00 YEAR 4 54.5 54.5 .00 .00 SEX 2 YEAR 1 94.5 94.5 .00 .00 YEAR 2 115.5 115.5 .00 .00 YEA

23、R 3 95.5 95.5 .00 .00 YEAR 4 153.5 153.5 .00 .00 Goodness-of-fit test statistics Likelihood ratio chi square = .00000 DF = 0 P = 1.000 Pearson chi square = .00000 DF = 0 P = 1.000下面,系统先显示某一阶及其更高阶交互效应为0时的似然比2检验概率值,因K为3时的概率值=0.19640.05,故认为年龄、性别、年份三者的交互作用为0,亦即含1阶(单一变量主效应)及2阶(变量两两交互效应)的模型就能恰当地表述数据。接着,系统

24、又显示特定阶交互效应为0时的似然比2检验概率值,结果表明,单纯含1阶(单一变量主效应)或单纯含2阶(变量两两交互效应)的模型也能恰当地表述数据。Tests that K-way and higher order effects are zero. K DF L.R. Chisq Prob Pearson Chisq Prob Iteration 3 6 8.615 .1964 8.547 .2007 4 2 17 404.424 .0000 425.168 .0000 2 1 23 1279.591 .0000 1293.594 .0000 0Tests that K-way effects

25、are zero. K DF L.R. Chisq Prob Pearson Chisq Prob Iteration 1 6 875.167 .0000 868.426 .0000 0 2 11 395.809 .0000 416.621 .0000 0 3 6 8.615 .1964 8.547 .2007 0 Note: For saturated models .500 has been added to all observed cells. This value may be changed by using the CRITERIA = DELTA subcommand.系统所确

26、定的模型中各参数值如下所示,由于内容较多,各值如何推算及其所表示的意义,请读者参阅本章第一节。Estimates for Parameters. AGE*SEX*YEAR Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI 1 -.1412276052 .08417 -1.67784 -.30621 .02375 2 .1674922915 .10130 1.65335 -.03106 .36605 3 -.0169870288 .07921 -.21447 -.17223 .13826 4 .0577506145 .05557

27、 1.03925 -.05117 .16667 5 -.0069187948 .06504 -.10637 -.13440 .12057 6 -.0817851831 .05570 -1.46819 -.19097 .02740 AGE*SEX Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI 1 .7059980126 .04848 14.56319 .61098 .80102 2 -.2968871102 .03276 -9.06301 -.36109 -.23268 AGE*YEAR Parameter Coeff. S

28、td. Err. Z-Value Lower 95 CI Upper 95 CI 1 -.1762097434 .08417 -2.09344 -.34119 -.01123 2 -.3051792054 .10130 -3.01249 -.50374 -.10662 3 .1339590237 .07921 1.69127 -.02129 .28920 4 .1990874838 .05557 3.58269 .09017 .30800 5 .1982170140 .06504 3.04744 .07073 .32570 6 -.1646071030 .05570 -2.95499 -.27

29、379 -.05543 SEX*YEAR Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI 1 .0471962901 .04918 .95960 -.04920 .14360 2 -.0778801067 .05818 -1.33868 -.19191 .03615 3 .0827715134 .04734 1.74836 -.01002 .17556 AGE Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI 1 -.7212868272 .04848 -1

30、4.87857 -.81630 -.62627 2 .7999110228 .03276 24.41872 .73571 .86412 SEX Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI 1 -.0348756276 .02856 -1.22099 -.09086 .02111 YEAR Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI 1 -.0205234390 .04918 -.41728 -.11692 .07588 2 -.3188195595

31、 .05818 -5.48020 -.43285 -.20479 3 -.0126524013 .04734 -.26725 -.10544 .08014系统开始对全饱和模型进行从高阶到低阶的效应项剔除。第一步,剔除3阶交互效应项(AGE*SEX*YEAR)导致2值为8.615,概率为0.1964(不小于默认判据0.05),故该效应项被剔除。第二步,剔除2阶交互效应项,概率均小于0.05,故2阶交互效应项不能剔除。即本例用2阶交互效应项(同时含1阶主效应项)描述模型已为最佳。Backward Elimination (p = .050) for DESIGN 1 with generating

32、 class AGE*SEX*YEAR Likelihood ratio chi square = .00000 DF = 0 P = 1.000If Deleted Simple Effect is DF L.R. Chisq Change Prob Iter AGE*SEX*YEAR 6 8.615 .1964 4Step 1 The best model has generating class AGE*SEX AGE*YEAR SEX*YEAR Likelihood ratio chi square = 8.61546 DF = 6 P = .196If Deleted Simple

33、Effect is DF L.R. Chisq Change Prob Iter AGE*SEX 2 310.816 .0000 2 AGE*YEAR 6 62.829 .0000 2 SEX*YEAR 3 13.024 .0046 2Step 2 The best model has generating class AGE*SEX AGE*YEAR SEX*YEAR Likelihood ratio chi square = 8.61546 DF = 6 P = .196The final model has generating class AGE*SEX AGE*YEAR SEX*YE

34、ARThe Iterative Proportional Fit algorithm converged at iteration 0.The maximum difference between observed and fitted marginal totals is .131and the convergence criterion is .278由于剔除了3阶交互效应项,故原全饱和模型变为层次模型,因而期望例数改变,期望例数与实际例数不同,进而残差、标准化残差均不为0。若标准化残差界于-1.961.96范围内,则表示模型是恰当的。从下面的结果可知,本例的标准化残差均在-1.961.9

35、6范围内,故层次模型是适合的。Observed, Expected Frequencies and Residuals.Factor Code OBS count EXP count Residual Std ResidAGE 1 SEX 1 YEAR 1 55.0 59.0 -4.05 -.53 YEAR 2 43.0 39.1 3.88 .62 YEAR 3 89.0 88.3 .69 .07 YEAR 4 140.0 140.5 -.50 -.04 SEX 2 YEAR 1 17.0 13.0 4.04 1.12 YEAR 2 9.0 12.9 -3.88 -1.08 YEAR 3 20.0 20.7 -.70 -.15 YEAR 4 41.0 40.5 .53 .08AGE 2 SEX 1 YEAR 1 165.0 163.0 1.99 .16 YEAR 2 101.0 97.9 3.07 .31 YEAR 3 104.0 112.6 -8.62

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1