计数资料的基本统计方法.ppt

上传人:本田雅阁 文档编号:2123494 上传时间:2019-02-19 格式:PPT 页数:71 大小:949.51KB
返回 下载 相关 举报
计数资料的基本统计方法.ppt_第1页
第1页 / 共71页
计数资料的基本统计方法.ppt_第2页
第2页 / 共71页
计数资料的基本统计方法.ppt_第3页
第3页 / 共71页
亲,该文档总共71页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《计数资料的基本统计方法.ppt》由会员分享,可在线阅读,更多相关《计数资料的基本统计方法.ppt(71页珍藏版)》请在三一文库上搜索。

1、计数资料的基本统计方法,温医公卫学院黄陈平,计数资料的基本统计方法, 相对数及其应用 率的标准化 二项分布 2检验 诊断性试验的分析和评价,什么是计数资料? 用什么指标进行描述?,一、相对数及其应用,甲、乙两地发生麻疹流行,甲地患儿100人,乙地患儿150人,何地较为严重? 若甲地易感儿童500人,而乙地易感儿童1000人。,甲地麻疹发病率为 100/500100%=20% 乙地麻疹发病率为 150/1000100%=15%,1. 常用相对数 (1)率,K为比例基数,其确定原则为: (1)习惯用法; (2)保留12位整数。,(2)构成比,各部分的构成比相加必等于100%,故又称百分比,(3)相

2、对比 两个有关联的指标之比。 注: 两指标互不包含。,2. 应用相对数时应注意的问题 (1)分母不宜过小 (2)避免以比代率 (3)注意平均率(合并率)的计算,(4)样本率或样本构成比的比较需假设检验 (5)注意可比性 若两个总率比较,其内部构成不同,并能影响其结果,需进行率的标准化。,二、 率的标准化,(1)直接法:,选择标准组的方法 1)大范围内的人口资料 2)两组年龄段人口合并 3)以其中一组为标准组,对另一组作标准化,(2)间接法:,注意事项: (1)标准化率不能反映实际水平,仅用于比较; (2)有明显交叉资料,则不能用标准化率比较; (3)若总率为样本率,仍需假设检验。,P: 标准组

3、死亡率;r:被标化组实际死亡数; niPi:被标化组预期死亡数;SMR:标准化死亡比,二、二项分布 1. 概念: 为率的抽样分布,各种情况的概率等于二项式展开各项。,0 3 生 生 生 0.2 0.2 0.2 0.008,1 2 死 生 生 0.8 0.2 0.2 生 死 生 0.2 0.8 0.2 生 生 死 0.2 0.2 0.8 0.096,2 1 死 死 生 0.8 0.8 0.2 死 生 死 0.8 0.2 0.8 生 死 死 0.2 0.8 0.8 0.384,3 0 死 死 死 0.8 0.8 0.8 0.512,P 1.000,(0.2 +0.8)3=(0.2)3 + 3(0.

4、8)(0.2)2 + 3(0.8)2(0.2) + (0.8)3 三生 二生一死 一生二死 三死,2. 概率的计算: (1)恰有X例阳性的概率:,(2)至少有k例阳性的概率:,(3)至多有k例阳性的概率:,3. 二项分布的图形,二项分布的特点: (1)离散型 (2)当=1-时,两边对称 (3)当n增大,二项分布逐渐逼近正态分布 一般认为,n 和 n( 1-) 5时, 可近似看作正态分布。 4. 率的标准误,表示率的抽样误差,5. 二项分布的应用 (1)总体率可信区间估计 1)查表法:n50,尤其p0 或 1时,现 n=41,x=19,p=46.34%。查附表6 ,P817 得:31% 63%,

5、若x n/2 ,则按n-x 查表得?,然后100-? 例:上题若 X=29,则 n-x=41-29=12 查表得:16% 46% 然后100-?得:54% 84%,2)正态近似法: 若n 50 或 n p和n( 1-p) 5时,(2)样本率与总体率比较 1)直接计算概率法,H0: 1 = 0 =0.01 H1: 1 0 =0.01 单侧 = 0.05,2)近似正态法: n 和n( 1-) 5时,H0: 1 = 0 =0.2 H1: 1 0 =0.2 单侧 = 0.05,(3)两样本率比较(近似正态法),四、2检验 用途: 率或构成比的假设检验 两分类变量间的相关分析 其它 类型: (一)四格表

6、资料的2检验 主要是两样本率比较 什么是四格表资料?,分析的基本思想,A:为实际数; T:为理论数。即在H0: 1 = 2 的条件下,基本格子中的频数。 基本思想为分析实际数与理论数的吻合度,T值的计算:,X2值大小除与 |A-T| 有关外,还取决于自由度,自由度一定时, X2值分布也一定。 P823,附表8 X2界值表,计算: (1)基本公式法:,H0: 1 2 H1: 1 2 = 0.05,查附表8,得:,(2)专用公式法:,(3) 2值校正: 当1 T 5,而且N 40,=3.03 查表得:P 0.05,若未校正,X2=4.47,P 0.05,应用条件 (1)T 5,而且N 40 直接用

7、2检验。 (2)1 T 5,而且N 40 校正2检验。 (3)T 1 或N 40, 不能用2检验。 注意:上述条件是以理论数未依据,而非实际数。,H0: B C H1: B C = 0.05,(二)配对四格表资料的2检验(McNemar法),应用条件: b+c40, b+c 40,注意:1、该法一般用于样本含量不太大的资料。 2、比较检出率时,对象应为确诊病例。,(三)四格表资料的Fisher确切概率法 当T 1 或N 40时,例:在某牧区观察慢性布氏病患者植物血凝素(PHA)皮肤试验反应,资料如下表,问活动型与稳定型布氏病患者PHA皮试反应阳性率有无差别?,H0: 1 = 2 H1: 1 2

8、 = 0.05,列出周边合计不变的四格表组合。,选取|A - T|值大于等于原始表格|A - T|值的组合,并计算其概率。,原始表格|A - T| = 1.4,P=0.0166+0.1423+0.1079=0.2688,问题:如何进行单侧检验?,若上例问稳定型患者PHA皮试反应阳性率是否高于活动型布氏病患者?,选取|A - T| 1.4 并且稳定型阳性数 3的组合。 即 P=P(1)+P(2)=0.1589,例:某防疫站观察当地的一个污水排放口,在高温季节和低温季节水样的伤寒菌检出情况,资料如下表,问两个季节污水的伤寒菌检出率有无差别?,P=(0.0007+0.0129) 2=0.0272,(

9、四)行列表资料的2检验 是多个样本率或构成比的比较 专用公式:,H0:三种处理方法的有效率相等 H1:三种处理方法的有效率不等或不全相等 = 0.05, = (3 - 1)(2 - 1)=2, 查表得:P 0.005,注意事项: 1、1/5格子以上1 T 5或任一格T 1 处理:1)增大样本含量 2)合理的合并或删除 3)RC表的Fisher确切概率法,2、等级资料一般不宜用2检验,问题:若上题用2检验,其结果说明什么?,根据2可分割原理,把率或比按一定规则(最接近原则)把样本以四格表形式分割出来,计算其2值,当差异无显著性时,就把它合并成一个样本,再把它与另一较接近的样本比较,如此进行下去直

10、到结束。,(1)进行2分割,3、 多个样本率两两比较,(2)调整检验水准(2k组资料) 1)共同对照组,药物1与安慰剂比较:,按 = 0.005的水准,尚不能拒绝H0,2)两两比较,若上例进行两两比较,则按=0.003水准来判断。,(五)两分类变量资料的关联性检验,1、双向无序分类资料的关联性检验,Pearson列联系数,Pearson列联系数介于 01之间,愈接近 0,关系愈弱,愈接近1,则关系愈密切。,H0:两种血型无关联(构成比无差别) H1:两种血型有关联(构成比有差别) = 0.05 本例:X2=213.16, v=6, P0.005,PA:实际观察一致率; PE:期望一致率,即偶然

11、机会 造成的一致率。,Kappa值波动于 0 1 之间。K=1,说明两次结果完全一致;若 K = 0,则完全由于机遇造成。 一般情况,K 0.75,一致性程度较好,K 0.4, 则较差。,2、双向有序同属性两分类变量的判断一致性检验,则:Kappa = (0.83 - 0.355)/(1 - 0.355)= 0.736 注意:样本资料计算出的Kappa值需要假设检验。,上表中红色数字为200例患者中两次检查结果一致的患者数,总计 166 例,一致率 PA = 166/200 = 0.83 若两次检查结果一致的患者数是随机的,则:,用等级相关分析,3、双向有序属性不同的两分类变量相关分析,(六)

12、关于2检验在其它方面的应用:,H0: 1 = 2 H1: 1 2 = 0.05,五、诊断性试验的分析和评价,诊断性试验包括 1、狭义的诊断性试验:即各种实验室检查。 2、广义的诊断性试验:除实验室检查外,还包括临床资料和影像诊断。,诊断性试验在临床上应用很广,可涉及病原学诊断、病因诊断、病理诊断、治疗效果评价指标、疾病预后判断指标等方面,临床医生需正确地选择和评价诊断性试验。,诊断性试验的研究步骤: 1、首先确定金标准或标准诊断; 2、选择研究对象,包括用金标准核实的病例 组和对照组; 3、用诊断性试验盲法同步测量研究对象; 4、将获得的结果与金标准比较。,评价指标: (一)真实性指标:反映测

13、量值与真值的差异程度。 1、灵敏度(真阳性率),2、特异度(真阴性率),两者存在矛盾,而且易受患病率影响。,3、准确度(符合率),4、诊断指数 = 灵敏度 + 特异度 理想值为 200%,不大于 100% 的试验方法不能成立,不大于170%的试验方法不宜采用。,5、阳性似然比 =,说明患者中阳性结果是非患者阳性结果的多少倍。,6、阴性似然比 =,说明患者中阴性结果是非患者阴性结果的百分之几。 阳性似然比与阴性似然比是反映灵敏度和特异度两方面特性,不易受患病率影响,较稳定。,7、阳性预测值 =,说明阳性者中真患者的比例。,8、阴性预测值 =,说明阴性者中非患者的比例。 阳性预测值与阴性预测值是评

14、价诊断性试验收益的指标。可受患病率的影响。,9、回收率,回收率是测定值对真值的相对百分比。其愈接近100%愈好。,说明用该方法检查,100名糖尿病患者中有75人呈阳性;而在100名非糖尿病患者中有61人呈阴性。,1、灵敏度(真阳性率),2、特异度(真阴性率),3、准确度(符合率),4、诊断指数,说明用该方法检查,糖尿病患者所得阳性结果约为非糖尿病患者的2倍;糖尿病患者所得阴性结果约为非糖尿病患者的4/10。,5、阳性似然比,6、阴性似然比,7、阳性预测值,8、阴性预测值,阳性预测值说明100人诊断试验阳性中,有66人是糖尿病;阴性预测值说明100人诊断试验阴性中,有71人不是糖尿病。为诊断性试验的收益指标。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1