列联表模型.docx

上传人:李医生 文档编号:10710752 上传时间:2021-05-31 格式:DOCX 页数:4 大小:19.36KB
返回 下载 相关 举报
列联表模型.docx_第1页
第1页 / 共4页
列联表模型.docx_第2页
第2页 / 共4页
列联表模型.docx_第3页
第3页 / 共4页
列联表模型.docx_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《列联表模型.docx》由会员分享,可在线阅读,更多相关《列联表模型.docx(4页珍藏版)》请在三一文库上搜索。

1、精品文档有些数据是类型变量,要求做因素影响的显著性分析或相关分析可以采用本模型本模型的相关分析涉及三种相关系数,而且是层层递进的,我们可以刻意将它们写成模型的一步步改进列联分析模型1.2.1 列联表列联表是由两个及两个以上的变量进行交叉分类的频数分布表。我们以是否就业 和政治面貌为例,可以有以下列联表(2 4):表 1.2.1群众团员党员其他总和就业b1Cld1ab1Gdi没就业a0boCodoaob0c0do总和aiaobboC1Codo d1n其中,n是总体样本数。交叉项为频数。1.2.2 列联表中2统计量2统计量常用于列联表中变量之间是否相关的检验。 用力表示观察值频数,用fe表示期望值

2、频数,则2统计量可以写为:2f0fefe(公式 1.2.2)随意编辑2的自由度计算:自由度二(行数-1)(列数-1 ) = (R-1 ) (C-1 )如表1.2.1 (2 4)列联表的2分布的自由度为(2-1 ) (4-1 ) =31.2.3 小相关系数测定与影响就业因素间的相关性小相关系数是描述2 2列联表数据相关程度较好的一种相关系数。计算公式为:(公式 1.2.3.1 )式中,2是按(公式1.2.2)计算出的2值;n为列联表中的总频数,及总体样 本数。由表1.1知,有五个影响因素是二分变量,我们可以采用小相关系数分析的方法。其列联表如下:表1.2.3是否就业与因素X的2 2列联表因素X总

3、计X1X2就业(1)aba+b没就业(2)cdc+d总计a+cb+d表1.2.3中,a,b,c,d均为条件频数。在2 2列联表中,每个单元中频数的期望值为:abacen na b b de12na c c d% nb d c de22n由(公式1.2.2)有:2222a , b % c 丽 d金2向1ei2e2ie222n ad bcabcd acbd将此结果代入(公式1.2.3.1 ),得到:(公式 1.2.3.1 )ad bcabcd acbd分析: 由上式我们知道,当 ab-bc时,(|)=0,两者完全独立。若 b=0,c=0,小=1;若a=0,d=0,(|)=-1 o由于列联表中,变量

4、的位置可以任意变换,因此小的符号在这里没实际意义,其绝对值=1只是表面两者完全相关。在此模型中,小的取值范围是在01之间,且小的绝对值越大,说明是否就业与因素 X的相关程度越 高。对于表1.1中的五个二分变量的因素的研究,我们可以采用2 2列联表的小 相关系数。但是对于其他的不是二分变量的因素,其在列联表R C中的列数C大于2时,小系数将随C的增大而增大,且小没上限。这时用小系数测定两者的 相关程度就不够清晰,所以,对其他的因素与是否就业之间的相关性的测定,我们采用列联相关系数。1.2.4 列联相关系数(C系数)测定与影响就业因素间的相关性列联相关系数用于大于2 2列联表的情况。C系数的计算公式为:c卜二(公式124)分析:C系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着 R和C的增大而增大。因此,根据不同的行和列计算的列联系数不能比较。所以,我们对方案进行改进,采用 V相关系数测定与影响就业因素间的相关性,并进行排序。1.2.5 V系数测定与影响就业因素间的相关性V系数是鉴于小系数无上限、C系数小于1的情况。计算公式为: 12V , (公式 1.2.5) n min R 1 , C 1式中表示取行数和列数中较小的一个。由于此模型中,行数均为 2,所以,得到 的V相关系数不随列数的增大而变化,我们可以用 V相关系数来比较各因素与 是否就业的相关性。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1