SPSS数据分析的医学统计方法选择.docx

上传人:大张伟 文档编号:6170423 上传时间:2020-09-16 格式:DOCX 页数:31 大小:112.13KB
返回 下载 相关 举报
SPSS数据分析的医学统计方法选择.docx_第1页
第1页 / 共31页
SPSS数据分析的医学统计方法选择.docx_第2页
第2页 / 共31页
SPSS数据分析的医学统计方法选择.docx_第3页
第3页 / 共31页
SPSS数据分析的医学统计方法选择.docx_第4页
第4页 / 共31页
SPSS数据分析的医学统计方法选择.docx_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《SPSS数据分析的医学统计方法选择.docx》由会员分享,可在线阅读,更多相关《SPSS数据分析的医学统计方法选择.docx(31页珍藏版)》请在三一文库上搜索。

1、.SPSS数据分析的医学统计方法选择目 录数据分析的统计方法选择小结错误 ! 未定义书签。目 录1资料 12完全随机分组设计的资料2配对设计或随机区组设计3变量之间的关联性分析4资料 251.连续性资料51.1 两组独立样本比较51.2 两组配对样本的比较51.3 多组完全随机样本比较61.4 多组随机区组样本比较62分类资料62.1 四格表资料62.2 2C表或 R2表资料的统计分析72.3 R C表资料的统计分析72.4 配对分类资料的统计分析8资料 38一、两个变量之间的关联性分析8二、回归分析9资料 410一统计方法抉择的条件101分析目的102资料类型103设计方法114分布特征及数

2、理统计条件12二数据资料的描述131数值变量资料的描述132分类变量资料的描述13三数据资料的比较141假设检验的基本步骤142假设检验结论的两类错误153假设检验的注意事项154常用假设检验方法16四变量间的相关分析171数值变量(计量资料)的关系分析18.2无序分类变量(计数资料)的相关分析183有序分类变量(等级资料)等级相关18资料 1完全随机分组设计的资料一、 两组或多组计量资料的比较1. 两组资料:1) 大样本资料或服从正态分布的小样本资料(1) 若方差齐性,则作成组 t 检验(2) 若方差不齐,则作t 检验或用成组的Wilcoxon 秩和检验2) 小样本偏态分布资料,则用成组的W

3、ilcoxon 秩和检验2. 多组资料:1) 若大样本资料或服从正态分布, 并且方差齐性, 则作完全随机的方差分析。 如果方差分析的统计检验为有统计学意义, 则进一步作统计分析: 选择合适的方法 (如:LSD检验, Bonferroni检验等)进行两两比较。2) 如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果 Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon 秩和检验,但用Bonferroni方法校正P 值等)进行两两比较。二、 分类资料的统计分析1. 单样本资料与总体比较1) 二分类资

4、料:(1) 小样本时:用二项分布进行确切概率法检验;(2) 大样本时:用 U检验。2) 多分类资料:用 Pearson 2 检验(又称拟合优度检验) 。2. 四格表资料1)n40 并且所以理论数大于5,则用 Pearson22)n40并且所以理论数大于1 并且至少存在一个理论数5,则用校正2 或用Fisher s确切概率法检验3)n40 或存在理论数40并且理论数小于5 的格子数 行列表中格子总数的25%,则用 Fisher s确切概率法检验4. R C 表资料的统计分析1) 列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则2CMH或 Kruskal Wallis的秩和检验2) 列

5、变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的 CMH 23) 列变量和行变量均为有序多分类变量,可以作Spearman 相关分析4) 列变量和行变量均为无序多分类变量,(1)n40并且理论数小于5 的格子数 行列表中格子总数的25%,则用 Fisher s确切概率法检验三、 Poisson 分布资料1. 单样本资料与总体比较:1) 观察值较小时:用确切概率法进行检验。2) 观察值较大时:用正态近似的U 检验。2. 两个样本比较:用正态近似的U检验。配对设计或随机区组设计四、 两组或多组计量资料的比较1. 两组资料

6、:1)大样本资料或配对差值服从正态分布的小样本资料,作配对t 检验2)小样本并且差值呈偏态分布资料,则用Wilcoxon 的符号配对秩检验2. 多组资料:1) 若大样本资料或残差服从正态分布, 并且方差齐性, 则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如: LSD检验, Bonferroni检验等)进行两两比较。2) 如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman 的统计检验。如果Fredman 的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用 Wilcoxon 的符号配对秩检验,但用 Bonferro

7、ni方法校正P 值等)进行两两比较。五、 分类资料的统计分析1. 四格表资料1)b+c40 ,则用 McNemar配对 2 检验或配对边际 2 检验.2)b+c40, 用二 分布确切概率法 2.C C表 料:1) 配 比 :用 McNemar配 2 或配 2 检验2) 一致性 ( Agreement ):用 Kap 检验变量之间的关联性分析六、 两个变量之间的关联性分析1. 两个 量均 型 量1) 小 本并且两个 量服从双正 分布, 用Pearson 相关系数做 分析2) 大 本或两个 量不服从双正 分布, 用Spearman 相关系数 行 分析2. 两个 量均 有序分 量,可以用Spearm

8、an 相关系数 行 分析3. 一个 量 有序分 量,另一个 量 型 量,可以用Spearman 相关系数 行 分析七、 回归分析1. 直 回 :如果回 分析中的残差服从正 分布(大 本 无需正 性),残差与自 量无 化, 直 回 ( 个自 量的 性回 ,称 回 ),否 作适当的 ,使其 足上述条件。2. 多重 性回 : 量( Y) 型 量(即 量 料) ,自 量( X1,X2,Xp)可以 型 量、有序分 量或二分 量。如果回 分析中的残差服从正 分布(大 本 无需正 性),残差与自 量无 化,可以作多重 性回 。1) 察性研究:可以用逐步 性回 找( )主要的影响因素2) 性研究:在保持主要研

9、究因素 量(干 量)外, 可以适当地引入一些其它可能的混 因素 量,以校正 些混 因素 果的混 作用3. 二分 的Logistic回 : 量 二分 量,自 量(X1,X2, Xp)可以 型 量、有序分 量或二分 量。1) 非配 的情况:用非条件Logistic回 (1) 察性研究:可以用逐步 性回 找( )主要的影响因素(2) 性研究:在保持主要研究因素 量(干 量)外,可以适当地引入一些其它可能的混 因素 量,以校正 些混 因素 果的混 作用2) 配 的情况:用条件 Logistic 回 (1) 察性研究:可以用逐步 性回 找( )主要的影响因素(2) 性研究:在保持主要研究因素 量(干 量

10、)外,可以适当地引入一些其它可能的混 因素 量,以校正 些混 因素 果的混 作用4. 有序多分 有序的 Logistic 回 : 量 有序多分 量, 自 量(X1,X2,Xp)可以 型 量、有序分 量或二分 量。1) 察性研究:可以用逐步 性回 找( )主要的影响因素.2) 性研究:在保持主要研究因素 量(干 量)外,可以适当地引入一些其它可能的混 因素 量,以校正 些混 因素 果的混 作用5. 无序多分 有序的 Logistic 回 : 量 无序多分 量, 自 量(X1,X2,Xp)可以 型 量、有序分 量或二分 量。1) 察性研究:可以用逐步 性回 找( )主要的影响因素2) 性研究:在保

11、持主要研究因素 量(干 量)外, 可以适当地引入一些其它可能的混 因素 量,以校正 些混 因素 果的混 作用八、 生存分析资料:(要求 料 局和 局 生的 ,如:死亡和死亡 生的 )1. 用 Kaplan-Meier 方法估 生存曲 2. 大 本 ,可以寿命表方法估 3. 因素可以用 Log rank 比 两条或多条生存曲 4. 多个因素 ,可以作多重的Cox 回 1) 察性研究:可以用逐步 性回 找( )主要的影响因素2) 性研究:在保持主要研究因素 量(干 量)外, 可以适当地引入一些其它可能的混 因素 量,以校正 些混 因素 果的混 作用资料 21. 连续性资料1.1 两组独立样本比较1

12、.1.1 料符合正 分布,且两 方差 性,直接采用t 。1.1.2 料不符合正 分布( 1)可 行数据 ,如 数 等,使之服从正 分布,然后 后的数据采用t ;( 2)采用非参数 , 如 Wilcoxon 。1.1.3 料方差不 ( 1)采用 Satterthwate的 t ;( 2)采用非参数 , 如 Wilcoxon 。1.2 两组配对样本的比较1.2.1两 差 服从正 分布,采用配 t 。.1.2.2两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。1.3 多组完全随机样本比较1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义

13、,则进一步作两两比较,两两比较的方法有LSD检验, Bonferroni法,tukey 法, Scheffe法, SNK法等。1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon 检验。1.4 多组随机区组样本比较1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验, Bonferroni法,tukey 法, Scheffe法, SNK法等。1

14、.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman 检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正 P 值,然后用符号配对的Wilcoxon 检验。需要注意的问题:( 1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用 t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。( 2) 当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组, 这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的

15、比较,这些两两比较有特定的统计方法,如上面提到的LSD 检验, Bonferroni法, tukey 法, Scheffe法, SNK法等。绝不能对其中的两组直接采用t 检验,这样即使得出结果也未必正确。( 3) 关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但不同设计会有差别。常用的设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。2分类资料2.1 四格表资料2.1.1例数大于40,且所有理论数大于5,则用普通的Pearson 检验。2.1.2 例数大于 40,所有理论数大于 1,且至少一个理论数小于 5,则用校正的检验或 Fisher s 确切概率法检验。.2.

16、1.3例数小于40,或有理论数小于2,则用 Fisher s 确切概率法检验。2.2 2 C 表或 R2 表资料的统计分析2.2.1列变量行变量均为无序分类变量,则( 1)例数大于 40,且理论数小于5 的格子数目 总格子数目的25,则用Fisher s确切概率法检验。2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson检验只说明组间构成比不同,如要说明疗效,则可用行平均分差检验或成组的Wilcoxon 秩和检验。2.2.3列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采用普通的 Pearson 检验比较各组之间有无差别,如果总的来说有差别,

17、还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。2.3 R C 表资料的统计分析2.3.1列变量行变量均为无序分类变量,则( 1)例数大于 40,且理论数小于5 的格子数目 总格子数目的25,则用Fisher s确切概率法检验。( 3)如果要作相关性分析,可采用Pearson 相关系数。2.3.2 列变量为效应指标, 且为有序多分类变量, 行变量为分组变量, 用普通的 Pearson 检验只说明组间构成比不同, 如要说明疗效或强弱程度的不同, 则可用行平均分差检验或成组的 Wilcoxon 秩和检验或Ridit分析。2.3.3列变量为效应指标,且为无序多分类变量,行变量为有序

18、多分类变量,则可采用普通的 Pearson 检验比较各组之间有无差别,如果有差别, 还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。2.3.4列变量行变量均为有序多分类变量( 1)如要做组间差别分析, 则可用行平均分差检验或成组的Wilcoxon 秩和检验或Ridit分析。 如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。( 2)如果要做两变量之间的相关性,可采用Spearson 相关分析。.2.4 配对分类资料的统计分析2.4.1四格表配对资料( 1) b c40 ,则用 McNemar配对检验。( 2) b c40 ,则用校正的配对检

19、验。2.4.1 C C 资料( 1)配对比较:用 McNemar配对检验。( 2)一致性检验,用 Kappa 检验。资料 3在研究设计时 ,统计方法的选择需考虑以下6 个方面的问题: (1) 看反应变量是单变量、双变量还是多变量 ;(2) 看单变量资料属于3 种资料类型(计量、计数及等级资料)中的哪一种 ; (3) 看影响因素是单因素还是多因素; (4)看单样本、两样本或多样本 ; (5)看是否是配对或配伍设计 ; (6)看是否满足检验方法所需的前提条件, 必要时可进行变量变换, 应用参数方法进行假设检验往往要求数据满足某些前提条件, 如两个独立样本比较 t检验或多个独立样本比较的方差分析,

20、均要求方差齐性 ,因此需要做方差齐性检验。 如果要用正态分布法估计参考值范围, 首先要检验资料是否服从正态分布。在建立各种多重回归方程时 , 常需检验变量间的多重共线性和残差分布的正态性。表 1-1连续因变量分类因变量连 续 自 变回归分析Logistic回归量分类自变量方差分析( ANOVA) 表格检验(比如卡方检验)不同的统计分析方法都有其各自的应用条件和适用范围。实际应用时 ,必须根据研究目的、资料的性质以及所要分析的具体内容等选择适当的统计分析方法,切忌只关心p 值的大小(是否 0.05 ) ,而忽略统计分析方法的应用条件和适用范围。一、两个变量之间的关联性分析1. 两个变量均为连续型

21、变量1)小样本并且两个变量服从双正态分布,则用Pearson 相关系数做统计分析2)大样本或两个变量不服从双正态分布,则用Spearman 相关系数进行统计分析2. 两个变量均为有序分类变量,可以用Spearman 相关系数进行统计分析.3. 一个 量 有序分 量,另一个 量 型 量,可以用Spearman 相关系数 行 分析二、回归分析1. 直 回 :如果回 分析中的残差服从正 分布(大 本 无需正 性),残差与自 量无 化, 直 回 ( 个自 量的 性回 ,称 回 ),否 作适当的 ,使其 足上述条件。2. 多重 性回 : 量( Y) 型 量(即 量 料),自 量(X1, X2,Xp)可以

22、 型 量、有序分 量或二分 量。如果回 分析中的残差服从正 分布(大 本 无需正 性),残差与自 量无 化,可以作多重 性回 。1) 察性研究:可以用逐步 性回 找( )主要的影响因素2) 性研究: 在保持主要研究因素 量 (干 量)外,可以适当地引入一些其它可能的混 因素 量,以校正 些混 因素 果的混 作用3. 二分 的Logistic回 : 量 二分 量,自 量(X1, X2, Xp)可以 型 量、有序分 量或二分 量。1) 非配 的情况:用非条件Logistic回 (1) 察性研究:可以用逐步 性回 找( )主要的影响因素(2) 性研究:在保持主要研究因素 量(干 量)外,可以适当地引

23、入一些其它可能的混 因素 量,以校正 些混 因素 果的混 作用2) 配 的情况:用条件 Logistic 回 (1) 察性研究:可以用逐步 性回 找( )主要的影响因素(2) 性研究:在保持主要研究因素 量(干 量)外,可以适当地引入一些其它可能的混 因素 量,以校正 些混 因素 果的混 作用4. 有序多分 有序的Logistic回 : 量 有序多分 量,自 量(X1,X2,Xp)可以 型 量、有序分 量或二分 量。1) 察性研究:可以用逐步 性回 找( )主要的影响因素2) 性研究: 在保持主要研究因素 量 (干 量)外,可以适当地引入一些其它可能的混 因素 量,以校正 些混 因素 果的混

24、作用5. 无序多分 有序的Logistic回 : 量 无序多分 量,自 量(X1,X2,Xp)可以 型 量、有序分 量或二分 量。1) 察性研究:可以用逐步 性回 找( )主要的影响因素2) 性研究: 在保持主要研究因素 量 (干 量)外,可以适当地引入一些其它可能的混 因素 量,以校正 些混 因素 果的混 作用。.资料 4一统计方法抉择的条件在临床科研工作中, 正确地抉择统计分析方法, 应充分考虑科研工作者的分析目的、 临床科研设计方法、 搜集到的数据资料类型、 数据资料的分布特征与所涉及的数理统计条件等。其中任何一个问题没考虑到或考虑有误,都有可能导致统计分析方法的抉择失误。此外,统计分析

25、方法的抉择应在科研的设计阶段来完成,而不应该在临床试验结束或在数据的收集工作已完成之后。对临床科研数据进行统计分析和进行统计方法 抉择时,应考虑下列因素:1分析目的对于临床医生及临床流行病医生来说,在进行统计分析前,一定要明确利用统计方法 达到研究者的什么目的。一般来说,统计方法 可分为描述与推断两类方法。一是统计描述(descriptivestatistics),二是统计推断(inferentialstatistics)。统计描述, 即利用统计指标、 统计图或统计表, 对数据资料所进行的最基本的统计分析,使其能反映数据资料的基本特征,有利于研究者能准确、 全面地了解数据资料所包涵的信息,以便

26、做出科学的推断。统计表,如频数表、四格表、列联表等;统计图,如直方图、饼图,散点图等;统计指标,如均数、标准差、率及构成比等。统计推断,即利用样本所提供的信息对总体进行推断(估计或比较),其中包括参数估计和假设检验,如可信区间、t 检验、方差分析、2 检验等,如要分析甲药治疗与乙药治疗两组的疗效是否不相同、不同地区某病的患病率有无差异等。还有些 统计方法 ,既包含了统计描述也包含了统计推断的内容,如不同变量间的关系分析。相关分析, 可用于研究某些因素间的相互联系,以相关系数来衡量各因素间相关的密切程度和方向,如高血脂与冠心病、慢性宫颈炎与宫颈癌等的相关分析;回归分析, 可用于研究某个因素与另一

27、因素(变量) 的依存关系, 即以一个变量去推测另一变量,如利用回归分析建立起来的回归方程,可由儿童的年龄推算其体重。2资料类型资 料 类 型 的 划 分 现 多 采 用 国 际 通 用 的 分 类 方 法 , 将 其 分 为 两 类 : 数 值 变 量(numericalvariable)资料和分类变量(categoricalvariable)资料。数值变量是指其值是可以定量或准确测量的变量,其表现为数值大小的不同;而分类变量是指其值是无法定量或不能测量的变量,其表现没有数值的大小而只有互不相容的类别或属性。分类变量又可分为无序分类变量和有序分类变量两小类,无序分类变量表现为没有大小之分的属性

28、或类别,如:性别是两类无序分类变量,血型是四类无序分类变量;有序分类变量表现为各属性或类.别间有程度之分 , 如:临床上某种疾病的“轻、中、重” ,治疗结果的“无效、显效、好转、治愈”。由此可见,数值变量资料、无序分类变量资料和有序分类变量资料又可叫做计量资料、计数资料和等级资料。资料类型的划分与统计方法 的抉择有关, 在多数情况下不同的资料类型,选择 的统计方法不一样。如数值变量资料的比较可选用t 检验、 u 检验等 统计方法 ;而率的比较多用2检验。值得注意的是, 有些临床科研工作者,常常人为地将数值变量的结果转化为分类变量的临床指标,然后参与统计分析,如患者的血红蛋白含量,研究者常用正常

29、、轻度贫血、中度贫血和重度贫血来表示,这样虽然照顾了临床工作的习惯,却损失了资料所提供的信息量。换言之, 在多数情况下, 数值变量资料提供的信息量最为充分,可进行统计分析的手段也较为丰富、经典和可靠,与之相比,分类变量在这些方面都不如数值变量资料。因此,在临床实验中要尽可能 选择 量化的指标反映实验效应, 若确实无法定量时, 才选用分类数据, 通常不宜将定量数据转变成分类数据。3设计方法在众多的临床科研设计方法中,每一种设计方法都有与之相适应的统计方法 。在统计方法 的抉择时, 必须根据不同的临床科研设计方法来选择相应的统计分析方法。 如果统计方法 的抉择与设计方法不一致,统计分析得到的任何结

30、论都是错误的。在常用的科研设计方法中,有成组设计(完全随机设计)的t 检验、配对 t 检验、成组设计(完全随机设计)的方差分析、配伍设计(随机区组设计)的方差分析等,都是统计方法与科研设计方法有关的佐证。因此,应注意区分成组设计(完全随机设计)与配对和配伍设计(随机区组设计) ,在成组设计中又要注意区别两组与多组设计。最常见的错误是将配对或配伍设计(随机区组设计)的资料当做成组设计(完全随机设计)来处理,如配对设计的资料使用成组 t 检验、配伍设计(随机区组设计)使用成组资料的方差分析;或将三组及三组以上的成组设计 (完全随机设计) 资料的比较采用多个t 检验、三个或多个率的比较采用四格表的卡

31、方检验来进行比较,都是典型的错误。如下表:表 1 常见与设计方法有关的 统计方法 抉择错误表格 1设计方法错误的 统计方法正确 统计方法两个均数的比较(成组设成组设计的 t 检验成组设计的秩和检验计、完全随机设计)多个均数的比较(成组设多个成组设计的 t检验完全随机设计的方差分析及q检计、完全随机设计)验、完全随机设计的秩和检验及两两比较数 值 变 量 的 配 对 设成组设计的 t 检验配对 t 检验、配对秩和检验计随 机 区 组 设 计 ( 配 伍 设多个成组设计的 t检验、随机区组设计的方差分析及q检.计)完全随机设计的方差分验、随机区组设计的秩和检验及两析两比较交叉设计成组设计的 t 检

32、验、配对交叉设计的方差分析、交叉设计的t 检验、配对秩和检验秩和检验4分布特征及数理统计条件数理统计和概率论是统计的理论基础。每种统计方法 都要涉及数理统计公式,而这些数理统计公式都是在一定条件下推导和建立的。也就是说, 只有当某个或某些条件满足时,某个数理统计公式才成立,反之若不满足条件时,就不能使用某个数理统计公式。在数理统计公式推导和建立的条件中,涉及最多的是数据的分布特征。数据的分布特征是指数据的数理统计规律,许多数理统计公式都是在特定的分布下推导和建立的。若实际资料服从(符合)某种分布, 即可使用该分布所具有的数理统计规律来分析和处理该实际资料,反之则不能。在临床资料的统计分析过程中

33、,涉及得最多的分布有正态分布、偏态分布、二项分布等。许多 统计方法 对资料的分布有要求,如:均数和标准差、t和 u 检验;方差分析都要求资料服从正态分布, 而中位数和四分位数间距、秩和检验等, 可用于不服从正态分布的资料。所以, 临床资料的统计分析过程中,应考虑资料的分布特征,最起码的要求是熟悉正态分布与偏态分布。例如:在临床科研中, 许多资料的描述不考虑资料的分布特征,而多 选择均数与标准差。如某妇科肿瘤化疗前的血象值,资料如下表:某妇科肿瘤化疗前的血象值表格 2指标名例数均数标准差偏度系数P 值峰度系数P 值血红蛋白 (g/L)98111.9918.820.1800.4590.0250.9

34、58血小板 ( 109/L) 98173.5887.111.3530.0001.8430.000白细胞 ( 109/L) 986.79302.7671.2070.0001.2020.013从上结果可见, 若只看三项指标的均数和标准差,临床医生也许不会怀疑有什么问题。但是经正态性检验, 病人的血红蛋白服从正态分布,而血小板和白细胞两项指标的偏度和峰度系数均不服从正态分布(P0.05 )。因此,描述病人的血小板和白细胞平均水平正确的指标是中位数,而其变异程度应使用四分位数间距。除了数据的分布特征外,有些数理统计公式还有其它一些的条件,如 t 检验和方差分析的方差齐性、卡方检验的理论数(T) 大小等

35、。总之,对于临床科研工作者来说,为正确地进行 统计方法 的抉择, 首先要掌握或熟悉上述影响 统计方法 抉择因素;其次,还应熟悉和了解常用统计方法 的应用条件。.二数据资料的描述统计描述的内容包括了统计指标、 统计图和表, 其目的是使数据资料的基本特征更加清晰地表达。本节只讨论统计指标的正确选用,而统计图表的正确使用请参阅其他书籍。1数值变量资料的描述描述数值变量资料的基本特征有两类指标, 一是描述集中趋势的指标, 用以反映一组数据的平均水平; 二是描述离散程度的指标, 用以反映一组数据的变异大小。 各指标的名称及适用范围等见表 2。表 3描述数值变量资料的常用指标表格 3指标名称用 途适用的资

36、料均数 ( X描述一组数据的平均水平,集中正态分布或近似正态分布)位置中位数( M)与均数相同偏态分布、分布未知、两端无界几何均数( G )与均数相同对数正态分布,等比资料标准差( S)描述一组数据的变异大小,离散正态分布或近似正态分布程度四分位数间距( QU-QL)与标准差相同偏态分布、分布未知、两端无界极差( R)与标准差相同观察例数相近的数值变量变异系数( CV)与标准差相同比较几组资料间的变异大小从表中可看出, 均数与标准差联合使用描述正态分布或近似正态分布资料的基本特征;中位数与四分位数间距联合使用描述偏态分布或未知分布资料的基本特征。这些描述指标应用时, 最常见的错误是不考虑其应用

37、条件的随意使用, 如:用均数和标准差描述偏态分布、 分布未知或两端无界的资料, 这是目前在临床研究文献中较为普遍和典型的错误。2分类变量资料的描述描述分类变量资料常用的指标有死亡率、患病率、发病率等。临床上, 这类指标的应用较多, 出现的错误也较多。 这些错误归纳起来大致有两类:一是以比代率, 即误将构成比 (proportion) 当做率 (rate) 来描述某病发生的强度和频率,如用某病的病人数除以就诊人数(或人次)得到“某病患病率”或“某病发病率”,就是典型的以比代率的例子。二是把各种不同的率相互混淆,如把患病率与发病率、死亡率与病死率等概念混同。需要指出的是, 单纯利用医院常规资料,最易得到的指标是构成比。而描述疾.病 生 度和 率的指 的率反映如患病率、 病率、 死亡率等, 很 利用医院的常 料(如医院医院的病例档案) 得。因 ,医院常 料无法得到 算 些率所需的分子和分母的 料。所以,一旦研究者利用的是医院常 料, 无法衡

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1