常用非参数统计方法.ppt

上传人:小小飞 文档编号:5044278 上传时间:2020-01-29 格式:PPT 页数:42 大小:699.50KB
返回 下载 相关 举报
常用非参数统计方法.ppt_第1页
第1页 / 共42页
常用非参数统计方法.ppt_第2页
第2页 / 共42页
常用非参数统计方法.ppt_第3页
第3页 / 共42页
常用非参数统计方法.ppt_第4页
第4页 / 共42页
常用非参数统计方法.ppt_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《常用非参数统计方法.ppt》由会员分享,可在线阅读,更多相关《常用非参数统计方法.ppt(42页珍藏版)》请在三一文库上搜索。

1、常用非参数统计方法,孙金芳 sjf_,流行病与卫生统计学系 东南大学公共卫生学院,概念复习,统计描述 数值资料 (P4 变量的分类) 集中趋势 平均数 (P9) 算术均数:单峰对称分布(正态、近似正态分布) 中位数: 偏态分布、分布不规则、开口资料 (位置指标,对分布不作要求),2020/1/29,2,2020/1/29,3,参数统计 VS 非参数统计,参数统计(parametric statistics):已知总体分布类型,通过样本统计量对总体参数进行估计和检验。 区间估计: t检验: u1= u2 ?要求独立随机样本、取自正态总体、方差齐性 非参数统计(nonparametric stat

2、istics):不依赖总体分布类型,不对参数进行估计或检验,通过样本观察值推断总体分布位置是否相同。,2020/1/29,4,非参数检验又称任意分布检验(distribution-free test)。 优点:资料分布特征要求较低,适用范围广,收集资料方便;对不满足参数方法的资料,效率高。 缺点:对适宜用参数方法的资料,若用非参数法处理,没有充分利用资料提供的信息,导致检验效能下降。犯第类错误概率比参数检验大。 非参数方法很多,主要介绍秩和检验(rank sum test) 。,1,4,10,2,3,11,13,12,14,15,5,6,7,8,9,16,2020/1/29,6,非正态分布:两

3、个班同学(n1,n2)从高到低、交错地排在队伍中,编号(即身高的秩次),若两个班同学身高相近(排列均匀),则每个班所报数字之和(秩和T)与其理论秩和相差不大。反之,则有理由相信其中一个班同学的身高比另一个班高。 比较 n1的秩和T与其理论秩和n1(N+1)/2,这就是秩和检验的思想。,秩(rank):观察值从小到大排序,该序号在统计学上称为秩/秩次; 秩和:秩次求和得到; 秩和检验:用秩和进行假设检验的方法。,秩(rank), 秩和(rank sum),秩和检验(rank sum test),秩和检验(rank sum test),用数据排序的秩来代替原数据进行假设检验: 位置检验,2020/

4、1/29,8,适宜作非参数检验的资料,计量资料,总体偏离正态性或总体分布未知 等级资料:痊愈、显效、有效、无效;-、 、+、+、+; 心功能分级;烧伤程度 边界不确定的资料:如出现50mg或0.5mg以下,2020/1/29,9,两样本比较秩和检验,例 测得铅作业与非铅作业工人的血铅值 (mol/L),问两组工人的血铅值有无差别?,SPSS 软件检验正态性与方差齐性结果,2020/1/29,10,2020/1/29,11,一、建立检验假设,确定检验水准,0:铅作业与非铅作业工人血铅值分布的位置相同, 1:铅作业与非铅作业工人血铅值分布的位置不同。 0.05,2020/1/29,12,二、计算检

5、验统计量T 值,混合编秩 0.24 0.24 0.29 0.33 0.44 0.58 0.63 0.72 0.82 0.87 0.87 0.97 1.01 1.21 1.64 2.08 2.13 遇有原始数据相同时,可分两种情况处理:相同数据在同一组,其秩次按位置的顺序。相同数据分在两组,均取其平均秩次(10+11)/2=10.5。,2020/1/29,13,2020/1/29,14,两组秩次分别相加 T1=93.5 T2=59.5 取较小样本的秩和记为统计量 T, 本例 n1=7,n2=10,取=T193.5 两组合计的秩和为多少?,2020/1/29,15,查附表12, n1=7, n2-

6、n1=10-7=3, 原则:内大外小 双侧0.05 42-84 拒绝 42 接受 84 拒绝 按0.05水准,拒绝H0,接受H1,故认为铅作业工人比非铅作业工人血铅值高。,三、确定P值和作出推断结论,2020/1/29,16,正态近似检验,公式为:,当相同秩次较多时,2020/1/29,17,等级资料的形式,例10.2 用某药治疗不同病情的老年慢性支气管炎病人,疗效见表10.2第(1)、(2)两栏,问该药对两种病情的老年慢性支气管炎病人的疗效是否相同?,常错误采用 卡方检验,2020/1/29,18,一、假设,H0:两种病情病人的疗效分布相同。 H1:两种病情病人的疗效分布不同。 =0.05,

7、2020/1/29,19,二、计算检验统计量uc值,排秩 求秩和 统计量T 。n1=82,T=8780.5 本例n1=82,n2=126,n2-n1=44,已超过附表12所列范围,,2020/1/29,20,2020/1/29,21,三、确定P值和作出结论推断 uc0.05,按=0.05水准尚不能拒绝H0,故认为本疗法对上述两种病情的患者并未显示出不同疗效。 卡方检验未考虑等级的强弱信息,秩和检验更适合于单向有序分类资料。,2020/1/29,22,多个样本比较的秩和检验,多个组资料: 1 有序分类资料 2 定量资料,但其不满足正态性或方差齐性 H检验(Kruskal-Wallis 法),20

8、20/1/29,23,例10.3 在研究白血病时,测得鼠脾的DNA含量如表10.3第(1)、(3)、(5)、(7)栏。问不同病情的鼠脾DNA含量有无差别?,2020/1/29,24,一、建立假设检验,确定检验水准,H0:四种鼠脾DNA含量总体分布位置相同。 H1:四种鼠脾DNA含量总体分布位置不同 或不全同。,2020/1/29,25,二、计算检验统计量,混合编秩: 由小到大排列,统一编秩 相同值:同组顺序编号,不同组取平均秩次。 计算各组秩和Ri (i=1,2,3,4) 计算统计量H值,2020/1/29,26,三、确定P值,作出统计推断,K=4, ni5, H20.05(3),即P3,最小

9、样本例数=5,近似服从自由度为k-1的卡方分布, 2 界值表。,2020/1/29,27,等级资料(校正H),例10.4某医生用三种方剂治疗某妇科病,疗效如表10.4,问三种方剂的疗效有无差别?,2020/1/29,28,假设 H0:三种方剂疗效分级的总体分布相同。 H1:三种方剂疗效分级的总体分布不同或不全同。 =0.05 求检验统计量Hc,2020/1/29,29,2020/1/29,30,多个样本间的多重比较,当多个样本比较的秩和检验拒绝H0,认为各总体分布位置不同或不全相同时,常需进一步作两两比较的秩和检验,以推断哪两个总体分布位置不同,或哪两个总体分布位置相同。 为此需进行组间的多重

10、比较(multiple comparison)。,2020/1/29,31,配对符号秩和检验,主要用于配对数值变量资料的检验。 例 用过硫酸铵分光光度法和示波极谱法测定水中锰的含量(mg/L),见表10.第(2)、(3)栏,问两法结果有无差别?,差值的正态性检验,2020/1/29,32,2020/1/29,33,检验的基本思想:,假定两种处理效应相同,则差值的总体分布是以0为对称的,即差值总体中位数为0。 相当于这些差值按绝对值大小编秩,再冠以原来的正、负符号,正秩与负秩在理论上是随机的,即正、负秩和应相近。 配对设计资料主要是对差值进行分析。,2020/1/29,34,H0:两种方法所测值

11、总体分布位置相同,即 (差值的总体中位数为零)。 H1:两种方法所测值总体分布位置不同,即 (差值的总体中位数不为零)。,一、建立假设检验,确定检验水准,2020/1/29,35,二、计算检验统计量 算出各对数值之代数差 d=xi-yi 编秩 a:将差值的绝对值从小到大编秩 b: 当差值为0,则不计该例(n随之减少) c: 如两差值相等,则取其平均秩次 给秩添加正负号 d0的秩次为“”;d0的秩次“”。 分别求出差值为正与负的秩和,任取差值为正或负秩和作为统计量。 T+ =22.5, T- =13.5。,2020/1/29,36,确定概率P,0.10 5-31 0.05 3-33 n=8。 0.02 1-35 0.01 0-36 T22.5或T13.5 原则:内大外小 P0.10 按=0.05水准,不能拒绝H0,尚不能认为两种方法测定锰含量有差别。,2020/1/29,37,正态近似法(N50),n50, 可利用秩和分布的正态近似法, 其中,统计量,2020/1/29,38,正态近似法公式确定概率P:,2020/1/29,39,统计学基本内容,分析资料的步骤: 1、确定资料的类型: 分类资料、定量资料; 2、选择适当的统计方法; 3、作出统计推断结论。,定量资料的分析:,t检验 Z(U)检验 (F检验),分类资料的分析:,检验,参数统计和非参数统计,2020/1/29,42,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1