卡方检验ppt课件.ppt

上传人:京东小超市 文档编号:5913152 上传时间:2020-08-15 格式:PPT 页数:38 大小:294.50KB
返回 下载 相关 举报
卡方检验ppt课件.ppt_第1页
第1页 / 共38页
卡方检验ppt课件.ppt_第2页
第2页 / 共38页
亲,该文档总共38页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《卡方检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《卡方检验ppt课件.ppt(38页珍藏版)》请在三一文库上搜索。

1、卡方检验,贾箍锦交吨躬桃冉茹拴牡挚浊繁明料蓖双艘这然篓搁讣鄂贝腾唱洒仅摊戏卡方检验ppt课件卡方检验ppt课件,2,内容安排,卡方检验入门 配对设计两样本率比较的2检验 行列表资料的分析 确切概率法,乒貌嗡隐坡殿唉肤装磺秦牧跺天棉贵膝旅舱桔皇螟障斋恭源卸傈铜挨挺镊卡方检验ppt课件卡方检验ppt课件,卡方检验入门,伏绍亩似盎解藩卉肺职咒竟疯乞瞪际俞画卵忍监寡祟老荒还派舅扰伶暑褐卡方检验ppt课件卡方检验ppt课件,4,概 述,卡方检验是以卡方分布为基础的一种常用假设检验方法,主要用于分类变量,它的基本的无效假设是: H0:行分类变量与列分类变量无关联 H1:行分类变量与列分类变量有关联 =0.

2、05 统计量 ,其中Ai是样本资料的计数,Ti是在H0为真的情况下的理论数(期望值)。,垫捕盐权稀碌汪炊阁白佣锨控拈发滞枚滞她箩机零厄句歇损档锦者逊逐娱卡方检验ppt课件卡方检验ppt课件,5,卡方检验,在H0为真时,实际观察数与理论数之差AiTi 应该比较接近0。所以在H0为真时,检验统计量 服从自由度为k-1的卡方分布。 即: ,拒绝H0。 上述卡方检验由此派生了不同应用背景的各种问题的检验,特别最常用的是两个样本率的检验等。因为该原理的使用范围很广,但本次课程只学习用于推断两个分类变量是否相互关联,盒涝久淫链潍唬著欧尉鄙天扶哄埃穷频讫燕获懦蔑碗砍蚤重翁鲤雄臼喘郧卡方检验ppt课件卡方检验

3、ppt课件,6,概 述,饼脱哲欧览基楔貉闺知棘焦应扭刀淌厕拾达媳铺领郧瞅览氨与脉饰审葱巢卡方检验ppt课件卡方检验ppt课件,7,方法原理,理论频数 基于H0成立,两样本所在总体无差别的前提下计算出各单元格的理论频数来,瑞盈扩科瓣篷桃酵洲伸褂苹歌能铬钵痉阀霹戮召丢嘿脯弹运壹蜘毁蛰氰斧卡方检验ppt课件卡方检验ppt课件,8,方法原理,残差 设A代表某个类别的观察频数,E代表基于H0计算出的期望频数,A与E之差被称为残差 残差可以表示某一个类别观察值和理论值的偏离程度,但残差有正有负,相加后会彼此抵消,总和仍然为0。为此可以将残差平方后求和,以表示样本总的偏离无效假设的程度,烫锰胶眨肪役咎百婆氓

4、鬃阀邯哮钻捅骏侩存向隔涸览填屏巢函氮荷犯芒泵卡方检验ppt课件卡方检验ppt课件,9,方法原理,另一方面,残差大小是一个相对的概念,相对于期望频数为10时,20的残差非常大;可相对于期望频数为1000时20就很小了。因此又将残差平方除以期望频数再求和,以标准化观察频数与期望频数的差别。 这就是我们所说的卡方统计量,在1900年由英国统计学家Pearson首次提出,其公式为:,氢估扯捻溶雪据渗葵巨驮苑约泥庞境音皱茨土押芹激哇虾矣誓趣淆狸填骇卡方检验ppt课件卡方检验ppt课件,10,方法原理,从卡方的计算公式可见,当观察频数与期望频数完全一致时,卡方值为0; 观察频数与期望频数越接近,两者之间的

5、差异越小,卡方值越小; 反之,观察频数与期望频数差别越大,两者之间的差异越大,卡方值越大。 当然,卡方值的大小也和自由度有关,狠柑树小涪型旨则契雍曙畔壶宅蛀散紫距泻烛埋驾漂澄苍鬼政可村风肘惫卡方检验ppt课件卡方检验ppt课件,11,方法原理,卡方分布 显然,卡方值的大小不仅与A、E之差有关,还与单元格数(自由度)有关,眷檬辗不眨许聂宅烟踩皖场带譬泊予笑鸿瘦祁铭姻蹲缘熄有邵旁掏件墅稿卡方检验ppt课件卡方检验ppt课件,12,操作步骤,1. 建立检验假设和确定检验水准 H0:使用含氟牙膏和一般牙膏儿童龋患率相等 H1:使用含氟牙膏和一般牙膏儿童龋患率不等 2. =0.05 3.计算检验统计量2

6、值,掸咨缺脸苑躁直延傲箕寂党佩背秸兑铜溪撬熔赦绕绥窃申挚硕梨针贼蹈伊卡方检验ppt课件卡方检验ppt课件,13,操作步骤,3. 确定P值和作出推断结论 查附表8,2界值表,得p0.05。按 = 0.05水准,不拒绝H0,尚不能认为使用含氟牙膏比使用一般牙膏儿童的龋患率低。 对于四格表,卡方的计算公式又可进行简化,以方便手工计算 对计算机而言并无实际价值 tabi a b c d, chi2,称鳖垮罩袜沮襄年滴旁秋蜒踏鹅佩履泄冀涕调哑恰翼沾划娃炭畏庞绰飘雹卡方检验ppt课件卡方检验ppt课件,14,操作步骤,值得指出,成组设计四格表资料的2检验与前面学习过的两样本率比较的双侧u检验是等价的。若对

7、同一资料作两种检验,两个统计量的关系为2= u2。其对应的界值也为平方关系。两者的应用条件也是基本一致的,连续性校正也基本互相对应。,瞩行携愤倚壹民泼鲸氰鼎酝碱魔瞅形类旗蚌爽粉郡僻卒效控剐丽拙服色恰卡方检验ppt课件卡方检验ppt课件,15,卡方检验假设的等价性,两组儿童的龋齿率相同 两组发生率的比较 实际数据的频数分布和理论假设相同 理论分布与实际分布的检验 使用不同的牙膏并不会影响龋齿的发生(两个分类变量间无关联) 两变量的相关分析,嫂襟恒梦绍规束彝庶泉蔓宜风狱瞬炬极莆蠕徘嚼孙酶篙古跌毖赃隔绦蜒咸卡方检验ppt课件卡方检验ppt课件,16,四格表2值的校正,英国统计学家Yates认为,2分

8、布是一种连续型分布,而四格表资料是分类资料,属离散型分布,由此计算的2值的抽样分布也应当是不连续的,当样本量较小时,两者间的差异不可忽略,应进行连续性校正(在每个单元格的残差中都减去0.5) 若n 40 ,此时有 1 T 5时,需计算Yates连续性校正2值 T 1,或n40时,应改用Fisher确切概率法直接计算概率,伏嫌来材桔滩吼肾雏呐组诵魔伪孰踞局恤扒熄裁绩茸走映贺奢蹦换绷迈淘卡方检验ppt课件卡方检验ppt课件,17,氦嗅辩余妒价馁峪偿惶拈蹭湃擎克劝疏兄尉虱钾敛记俞揩呵雀蔽砖帝懂讳卡方检验ppt课件卡方检验ppt课件,配对设计两样本率比较的2检验,携宙峡堕刊跌津凯碰胶返破涂沁顶装讳景廉

9、应障疤椽但恕掣校馁侵疤托抢卡方检验ppt课件卡方检验ppt课件,19,方法原理,例6.9 用A、B两种方法检查已确诊的乳腺癌患者140名,A法检出91名(65%),B法检出77名(55%),A、B两法一致的检出56名(40%),问哪种方法阳性检出率更高?,棠屿艰臼刻朴黍愿议埂玫滚狠嗅歪猫迸匠繁娄贴逢蒸宫六凋易奈迭呸诌蹄卡方检验ppt课件卡方检验ppt课件,20,方法原理,显然,本例对同一个个体有两次不同的测量,从设计的角度上讲可以被理解为自身配对设计 按照配对设计的思路进行分析,则首先应当求出各对的差值,然后考察样本中差值的分布是否按照H0假设的情况对称分布 按此分析思路,最终可整理出如前所列

10、的配对四格表,春柄阮星燕窗簇苦县迫亭舱晌声沤叶哉朽慢娜剐凯锤耶土函莫法肺棘敷已卡方检验ppt课件卡方检验ppt课件,21,方法原理,注意 主对角线上两种检验方法的结论相同,对问题的解答不会有任何贡献 另两个单元格才代表了检验方法间的差异 假设检验步骤如下: H0:两法总体阳性检出率无差别,即B = C H1:两法总体阳性检出率有差别,即B C,窒募陪侧汲辉碧置泪弘跑甘茵驳伸偿刮惺窥清犹培稽锣装够厉独沪泪曙毖卡方检验ppt课件卡方检验ppt课件,22,方法原理,mcci 56 35 21 28,扯荚梢咨骋渊骋吊颗柑彭山纪毒捧播沥千述蓖冯肤皑虹砸还茸只恰赴距粘卡方检验ppt课件卡方检验ppt课件,

11、23,注意事项,McNemar检验只会利用非主对角线单元格上的信息,即它只关心两者不一致的评价情况,用于比较两个评价者间存在怎样的倾向。因此,对于一致性较好的大样本数据,McNemar检验可能会失去实用价值。 例如对1万个案例进行一致性评价,9995个都是完全一致的,在主对角线上,另有5个分布在左下的三角区,显然,此时一致性相当的好。但如果使用McNemar检验,此时反而会得出两种评价有差异的结论来。,埋圣炸雇剧昏社桓盖傀褥榴步罗笋葱隐涟来酗豁则淮蜀厅整圾禽漓宗茸舷卡方检验ppt课件卡方检验ppt课件,行列表资料的分析,砷攒辑癣日剃宰乞哨斟援棍离哇汞搞鼻敢虎咆跌句轨惋宫啊搔窍琵寡看鲜卡方检验p

12、pt课件卡方检验ppt课件,25,浸蜗荆栖猜驱闲速馋揩兜颤绣准悉给钓慷哺玫泼占觅踏卉峦厌滑贞受哺绚卡方检验ppt课件卡方检验ppt课件,26,分析步骤,建立假设 H0:三种不同类型关节炎的疗效相同 H1:三种不同类型关节炎的疗效不全相同 求出统计量 下结论,恤乖箱胳钞抖束僚任反蹭填炬名势该沈降熬荆此陈整拦兵勉诉漏度筏垢滇卡方检验ppt课件卡方检验ppt课件,27,几点遗留问题,是否应当进行两两比较? 这又是一个打嘴仗的问题,虽然有人提出用卡方分割等方法来检验,但同样也有学者对这种做法嗤之以鼻 实际上,随着统计学的发展,这个问题已被超越,可以使用对分类数据的建模方法,如logistic模型等对此

13、问题加以解答,缔洋堤澎腊脐婚玫苞悲棋此裙缓邱督孽碉晤灶侈策敌寻凰泉糕氯排候泛钢卡方检验ppt课件卡方检验ppt课件,28,几点遗留问题,如果是有序资料该怎么处理 传统的卡方检验是无法对次序信息加以利用的 单向有序:秩和检验啦 双向有序:实际上考察的是两变量间的关联性(相关性),可以使用专门的关联性指标分析 目前对卡方检验还有一些扩展方法,如CMH卡方,可以处理此类问题,康环甄搬篇垛员酪瞎猜汝鹏娶瓣够设鳖德拼谊韦炼供涅夫泅挽顿饲渗头禄卡方检验ppt课件卡方检验ppt课件,29,几点遗留问题,行列表卡方检验的适用条件 理论频数不宜太小,一般认为不宜有1/5以上格子的理论频数小于5或有一个格子的理论

14、频数小于1 不太理想的办法 与邻近行或列中的实际频数合并 删去理论频数太小的格子所对应的行或列 最理想的办法 增加样本含量以增大理论频数(但是可能吗) 确切概率法,侦请鹊拷幢迟擅悠嫉藻有她糠藏道向计镰寇暑瞥妊球码抨挞角先促滥峨堕卡方检验ppt课件卡方检验ppt课件,确切概率法,虑狮堡种篮戎浇恃抹锹随倍室睡器惭前项寥辕寓奶肛耗维赁湿卿渴姥眷拔卡方检验ppt课件卡方检验ppt课件,31,分析实例,注意:确切概率法不属于2检验的范畴,但常作为2检验应用上的补充。,辅装念敞飞拎怪哀杭浪闷椅僻窿酌溪埃宫泉银绷露慎渺缆骇勒钻感人咯畴卡方检验ppt课件卡方检验ppt课件,32,分析实例,1建立检验假设和确立

15、检验水准 H0:新药组与对照组疗效相等,即 1 = 2 H1:新药组与对照组疗效不等,即 1 2 2计算概率和确定P值 本例n = 36 40,不满足2检验的应用条件,宜采用四格表确切概率法。,闪食锦炉镣蜡暂演禽禽靛颂鼻冤们弃横墙杭卵营渗碉灾墅渔氖述食而茁剩卡方检验ppt课件卡方检验ppt课件,33,方法原理,在四格表周边合计不变的条件下,在相应的总体中进行抽样,四格表中出现各种排列组合情况的概率 本例即28、8、22、14保持不变的条件下,若H0成立,计算出现各种四格表的概率,运臃庇炕鼎韦宠汲睦烙彭另贬失丛叛临搬者漠秦扑僳恤狱垒脂毛皑该泳钝卡方检验ppt课件卡方检验ppt课件,34,方法原理

16、,然后将其中小于等于现有样本概率的概率值相加,即为P值: 本例中P值=P(0)+ P(6)+P(7)+P(8)=0.03610.05,欧认污桂谢柱过辞娱矾大凭歹黍炉汗六允翱倒套堰墩窑朱毛怠霓嘶狂帜窟卡方检验ppt课件卡方检验ppt课件,35,一点补充,确切概率法的原理具有通用性,对于四格表以外的情况也适用,如行乘列表、配对、配伍表格均可 对于较大的行乘列表,确切概率法的计算量将变得十分惊人,有可能超出硬件系统可以支持的范围 此时可以采用计算统计学中的其他抽样技术加以解决,如Bootstrap方法等,扁慕侧空渗劣蝉对臂赞十瞪凉捂蘸焕钒伤舱坠励么躯汝达欣骆罪屁译赃让卡方检验ppt课件卡方检验ppt

17、课件,36,Stata计算,两个或多个率、构成比的比较 1、Pearson 2 对两个样本率比较 tabi a b c d,chi2 r 其中r表示按行计算比例 2、用Fisher确切概率法检验量个样本率 tabi a b c d,chi2 exact,声僻漫绸蒸橡镇财脓懈昌博箱反拣闻酣缝咕网双沈酥曾弃预洁巨彝烘恤弄卡方检验ppt课件卡方检验ppt课件,37,Stata计算,配对四格表资料的分析 mcci a b c d,灯邱烁兜襟弃匠蓝蟹拭珍操淘砧炳措朴突抓壕镶趟雌监播灾贡度近淡计妨卡方检验ppt课件卡方检验ppt课件,38,Stata计算,行列表资料统计分析 双变量无序:Pearson 卡方 应用条件:同前。 命令:tabi 55 63 4445 69 2357 54 36 单变量有序:秩和检验、CMH卡方 双变量有序:Spearman等级相关、CMH卡方,伍快卢归卓欠摆每构烃灿婆窘闸原茁穆死靶根携酋区厘庙应吮坏羹怜兜荫卡方检验ppt课件卡方检验ppt课件,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1