卡方检验及SPSS分析.ppt

上传人:本田雅阁 文档编号:2147735 上传时间:2019-02-22 格式:PPT 页数:78 大小:1.60MB
返回 下载 相关 举报
卡方检验及SPSS分析.ppt_第1页
第1页 / 共78页
卡方检验及SPSS分析.ppt_第2页
第2页 / 共78页
卡方检验及SPSS分析.ppt_第3页
第3页 / 共78页
亲,该文档总共78页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《卡方检验及SPSS分析.ppt》由会员分享,可在线阅读,更多相关《卡方检验及SPSS分析.ppt(78页珍藏版)》请在三一文库上搜索。

1、卡方检验及SPSS分析 Chi-Square Test,,主要内容,第一节 四格表资料的 检验 第二节 配对四格表资料的 检验 第三节 四格表资料的Fisher确切概率法 第四节 行列表资料的 检验 第五节 多个样本率间的多重比较,,SPSS统计分析,交叉表(Crosstabs)过程 (一)四格表(fourfold data)资料的x2检验 (二)配对(paired data)资料的x2检验 (三)RC表资料的x2检验 (四)两分类变量有无关联分析及列联系数C 卡方(Chi-Square)过程 (五)拟合问题-比较样本与已知总体的分布,,第一节 四格表资料的 检验 x2 test of fou

2、rfold data,,目的:推断两个总体率(构成比)是否有差 别(和率的u检验等价) 要求:两样本的两分类个体数排列成四格表 资料,,值计算 Pearson卡方值: 自由度:,一、 检验的基本思想,,,分布,,实例分析,例7-1 某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见表7-1。问两组降低颅内压的总体有效率有无差别? 表7-1 两组降低颅内压有效率的比较,,检验基本步骤,计算理论频数: 计算 统计量,建立检验假设 : 两总体阳性率相等 : 两总体阳性率不等,H0,H1,,,值的校正,四格表 检验的条件: 1

3、) 2) 3) 校正公式:,,SPSS操作过程,建立数据文件:chis01.sav 数据格式:包括4行3列的频数格式,3个变量即行变量(group)、列变量(effect)和频数变量(freq)。 说明频数变量:数据 加权个案 Data Weight Cases x2检验:从菜单选择 分析 描述统计 交叉表 Analyze Descriptive Statistics Crosstabs 结合例7-1数据(chis01.sav)演示操作过程。,,分类数据录入格式,频数格式:用数据 加权个案(Weight Cases)过程以指明反映频数的变量。 枚举格式:,,交叉表(Crosstabs)过程,C

4、rosstabs过程用于对分类资料和有序分类资料进行统计描述和统计推断。 该过程可以产生2维至n 维列联表,并计算相应的百分数指标。 统计推断包括了常用的x2检验、Kappa值,分层X2(X2M-H),以及四格表资料的确切概率(Fishers Exact Test)值。,,Crosstabs过程祥解,界面说明 -行Rows框用于选择行列表中的行变量。 -列Columns框用于选择行列表中的列变量。 -层Layer框指定分层变量,即控制变量。如果要指定不同的分层变量做分析,则将其选入Layer框,并用Previous和Next钮设为不同层。 -Display clustered bar char

5、ts 复选框:显示复式条图 -Suppress table复选框:不在输出结果中给出行列表。,,Crosstabs过程祥解,界面说明 精确(Exact)子对话框:针对22以上的行列表设计计算确切概率的方法。 统计量(Statistics)子对话框:用于定义所需计算的统计量 -Chi-square 复选框:计算pearson卡方值,对四格表资料自动给出校正卡方检验和确切概率法结果。 -Correlations复选框:计算行列变量的pearson相关系数和Spearman等级相关系数。,,Crosstabs过程祥解,界面说明 -Kappa复选框:计算Kappa值,即内部一致性系数,介于00.707

6、1之间; -Risk复选框:计算比数比OR值、RR值; -McNemanr复选框:进行配对卡方检验的McNemanr检验(一种非参数检验) -Cochrans and Mantel-Haenszel statistics复选框:计算X2M-H统计量、X2CMH,可在下方输出H0假设的OR值,默认为1。,,Crosstabs过程祥解,界面说明 单元格(Cells)子对话框:用于定义列联表单元格中需要计算的指标。 -Counts复选框:是否输出实际观察数(Observed)和理论频数(Expected) -Percentages复选框:是否输出行百分数(Row)、列百分数(Column)以及合计百

7、分数(Total) -Residuals复选框:选择残差的显示方式 格式(Format)子对话框:用于选择行变量是升序还是降序排列。,,SPSS结果输出,,SPSS结果输出(续),结论:x2=12.857, df=1,双侧P0.01,按照=0.05检验水准,可 认为两组总体有效率差异显著,即试验组的疗效优于对照组。,,结果中的其他检验方法,连续性校正的卡方检验 Continuity Correction Fishers确切概率法 Fishers Exact Test 似然比卡方 Likelihood Ratio 线性相关性检验 Linear-by-Linear Association:仅用于当

8、两变量均为等级变量的资料。 注意检查样本例数n和理论频数T是否满足条件: N40且理论频数T5。,,第二节 配对四格表资料的 检验 x2 test of paired fourfold data,,例7-3 某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表7-3。问两种方法的检测结果有无差别?,实例分析,,表7-3 两种方法的检测结果,,上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有四种可能:,两种检测方法皆为阳性数(a); 两种检测方法皆为阴性数(d); 免疫荧光法为阳性,乳胶凝集法为 阴性数(b); 乳胶凝集法为阳性,免疫荧光法为

9、 阴性数(c)。,,其中,a, d 为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况。,检验统计量为,,注意:,本法一般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况(b, c),而未考虑样本含量n和两法结果一致的两种情况(a, d)。所以,当n很大且a与d的数值很大(即两法的一致率较高),b与c的数值相对较小时,即便是检验结果有统计学意义,其实际意义往往也不大。,,检验步骤:,,SPSS操作过程,建立数据文件:chis03.sav 数据格式:包括4行3列的频数格式,三个变量分别为行变量、列变量和频数变量。 说明频数变量:数据 加权个案 Data Wei

10、ght Cases x2检验:从菜单选择 分析 描述统计 交叉表 Analyze Descriptive Statistics Crosstabs 统计量Statistics: McNemar Kappa,,一致性检验:计算Kappa系数 Kappa系数:为吻合度测量(measure of agreement)系数,用以测量两个观测者或两观测设备之间的吻合程度,取值在-1至+1之间,取值越大,说明吻合程度越高。该系数利用了列联表的全部信息,包括表格中的数据a和d。 Kappa0.75一致性好 0.75Kappa 0.4一致性一般 Kappa0.4一致性较差,,SPSS结果输出,结论:配对x2检

11、验的P0.05,可以认为两种方法的检测结果差别显著,免疫荧光法的总体阳性检出率要高于乳胶凝集法;对两种检测方法的一致性检验Kappa=0.455,P0.01,说明两种方法的吻合度有统计学意义,但吻合度一般。,,第四节 行列表资料的 检验 test of RC table,,行列表资料, 多个样本率比较时,有R行2列,称为R 2表; 两个样本的构成比比较时,有2行C列,称2C表; 多个样本的构成比比较,以及双向无序分类资料关联性检验时,称为R C表。,,检验统计量,,一、多个样本率的比较,,例7-6 某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表7-8。问三种

12、疗法的有效率有无差别? 表7-8 三种疗法有效率的比较,,检验步骤:,,SPSS操作过程(行列表卡方检验),建立数据文件:chis02.sav(例7-6数据) 数据格式:包括6行3列的频数格式,3个变量分别为行变量、列变量和频数变量。 说明频数变量:数据 加权个案 Data Weight Cases x2检验:从菜单选择 分析 描述统计 交叉表 Analyze Descriptive Statistics Crosstabs 结合例7-6数据(chis02.sav)演示操作及界面。,,SPSS结果输出,,SPSS结果输出(续),结论:按=0.05检验水准拒绝H0,接受H1,可以认为三种疗法治疗

13、周围性面神经麻痹的总体有效率有差别。,,二、样本构成比的比较,,例7-7 某医师在研究血管紧张素I转化酶(ACE)基因I/D多态(分3型)与2型糖尿病肾病(DN)的关系时,将249例2型糖尿病患者按有无糖尿病肾病分为两组,资料见表7-9。问两组2型糖尿病患者的ACE基因型总体分布有无差别?,表7-9 DN组与无DN组2型糖尿病患者ACE基因型分布的比较,,检验步骤,,三、双向无序分类资料的关联性检验,表中两个分类变量皆为无序分类变量的行 列表资料,又称为双向无序 表资料。 注意: 双向无序分类资料为两个或多个样本,做差别检验(例7-7);若为单样本,做关联性检验(例7-8) 。,,例 7-8

14、测得某地5801人的ABO血型和MN血型结果如表7-10,问两种血型系统之间是否有关联?,表7-10 某地5801人的血型,(单样本,做关联性检验),,表7-10资料,可用行列表资料 检验来推断两个分类变量之间有无关系(或关联);若有关系,可计算Pearson列联系数C进一步分析关系的密切程度:,列联系数C取值范围在00.7071之间。0表示完全独立;0.7071表示完全相关。,,检验步骤,,由于列联系数C=0.1883,数值较小,故认为两种血型系统间虽然有关联性,但关系不太密切。,,SPSS操作过程,建立数据文件:chis04.sav 数据格式:包括12行3列的频数格式,三个变量分别为行变量

15、、列变量和频数变量。 说明频数变量:数据 加权个案 Data Weight Cases x2检验:从菜单选择 分析 描述统计 交叉表 Analyze Descriptive Statistics Crosstabs 统计量Statistics: Chi-square 名义 相依系数Contingency coefficient,,SPSS输出结果,,,1行列表中的各格T1,并且1T5的格子数不宜超过格子总数的1/5,否则可能产生偏性。处理方法有三种: (1)增大样本含量以达到增大理论频数的目的(首选)。(2)根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列

16、合并。如:不同年龄组可以合并,但不同血型就不能合并。 (3)改用双向无序RC表的Fisher确切概率法。,四、行列表资料 检验的注意事项,,,,第五节 多个样本率间的多重比较 Multiple comparison of sample rates,,一、基本思想(卡方分割法),因分析目的不同,k个样本率两两比较的次数不同,故重新规定的检验水准的估计方法亦不同。通常有两种情况:,,,,,例7-9 对例7-6中表7-8的资料进行两两比较,以推断是否任两种疗法治疗周围性面神经麻痹的有效率均有差别?,,检验步骤,本例为3个实验组间的两两比较,,表7-12 三种疗法有效率的两两比较,,,例 7-10 以

17、例7-6表7-8资料中的药物治疗组为对照组,物理疗法组与外用膏药组为试验组,试分析两试验组与对照组的总体有效率有无差别?,本例为各实验组与同一对照组的比较,,,第三节,四格表资料的Fisher确切概率法 Fisher probabilities in fourfold data,,(一)适用条件 T1或 n40 P,(二)基本思想(超几何分布),在四格表周边合计不变的条件下,直接计算表内四个数据的各 种组合之概率。找出 的所有表格并将概率求 和,若这些表的合计P ,则推翻H0假设。,,(三)检验步骤,假设H0、H1,2. 计算最小理论频数 及 值,边缘合计不变条件下,变动表中数据,3. 找出边

18、缘合计中的最小值,对应的格子中的数据从0 到 ,排出所有 可能的四格表。,5. 选出 值的所有表,分别求P值后相加。,,表 7 两型慢性布氏病的PHA皮试反应,(四)应用 (结合实例),,表 8 确切概率法计算表(四格表周边合计不变),,SPSS操作过程,建立数据文件:chis05.sav(表7数据) 数据格式:包括4行3列的频数格式,3个变量即行变量(group)、列变量(effect)和频数变量(freq)。 说明频数变量:数据 加权个案 Data Weight Cases x2检验:从菜单选择 分析 描述统计 交叉表 Analyze Descriptive Statistics Cros

19、stabs 结合表7数据(chis05.sav)演示操作过程。,,SPSS输出结果,,SPSS输出结果,,小 结,一、四格表资料的 检验*,二、配对四格表资料的 检验*,三、行列表的 检验 *,四、行列表的 分割*,五、四格表资料的Fisher确切概率法,,(五)比较样本与已知总体的分布 Chi-square test 过程,目的:用于检验某分类变量的各部分所占百分比与已知的期望百分比是否相同,从而推断该样本与已知总体的分布是否相同。 SPSS操作: 分析非参数检验 卡方(chi-square),,实例分析,SPSS自带文件Eployee data.sav 考察员工职务类别(jobcat)变量所在总体的构成比是否和已知总体的构成比相同?,,练习题:,1)如果希望分析甲乙两药对疾病治疗情况有无差别,应当选择什么分析方法,为什么? 2)可以用到SPSS的什么过程实现?请给出具体的P值和分析结论。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1