医学统计方法选择流程.doc

上传人:scccc 文档编号:11245274 上传时间:2021-07-17 格式:DOC 页数:10 大小:212.50KB
返回 下载 相关 举报
医学统计方法选择流程.doc_第1页
第1页 / 共10页
医学统计方法选择流程.doc_第2页
第2页 / 共10页
医学统计方法选择流程.doc_第3页
第3页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《医学统计方法选择流程.doc》由会员分享,可在线阅读,更多相关《医学统计方法选择流程.doc(10页珍藏版)》请在三一文库上搜索。

1、t检验医学统计方法选择流程图(含第 9-14讲内容)资料量资料定性资料单水平两水平多水平四格表RXC表1独立2.正态1.独立2.非正态1. 独立;2. 正态;3. 方差齐方差分析1独立;2. 正态;3. 方差不齐1. 独立;2. 非正态;n 4且所有的T5n 40旦有 1WTv 5当nv 40或 Tv 1;Pa配对设计2X2列联表Welch方差分析Kruskal-WallisH检验2检验u检验(n60 或总体标准差已知)秩和检验两两比较的方法 LSD法、Bonferroni 法、Sidak 法、Scheff 法、Tukey法、 Duncan 法、SNK法、Dunnett t 法两两比较:连续性

2、 校正2 检验Fisher精确概率法总体率差异性检验一致性检验McNemar 检验配对设计成组设计Mann-Whitney U检验、Dunn法、Nemenyi 法横断面研究无后续检验队列研究 计算RR MH 2检验病例对照研究 计算OR MH 2检验Kappa检验1. 独立2. 每对数据 差值服从 正态分布1. 独立2. 每对数据差 值不服从正态 分布。配对设计t检验配对设计符号秩检验1. 独立;2. 两组数据 服从正态 分布;3. 两组数据 的总体方 差相等;1. 独立;2. 两组数据 服从正态 分布;3. 两组数据 的总体方 差不相等;1. 独立;2. 两组数据 不服从正 态分布;双向无序

3、*结果变量有序成组设计t检验u检验(两组n 都大于60或总 体标准差已知)Wilcox on秩和检验成组设计t检验(Cochran 法、Satterthwaite 法和Welch法)2检验秩和检验Fisher精Ridit分析确概率:有有序变量1/5以上格子的 Logistic 回的理论频数归分析。小于5。双向有序 属性不同d频数分布是否相同按双向无序处理结果变量之间差别按单向有序处理原因与结果变量关系Spearman秩相关两变量相关关系线性趋势检验双向有序 属性相同Kappa检验当我们看到一个题目时,首先应该想到老 师打算考我们什么,比如是头验设计还是 假设检验或者统计描述等然后在相应的 章节

4、选择答案。当考假设检验或者相关分析时,定要先 看数据类型,疋疋性资料还疋疋量资料, 而后看设计方式,比如是定量资料的配对 设计中,不服从正太性时,我们只能使用 Wilcox on符号秩检验,假如是定性资料的 四格表我们只能使用卡方检验或是确切 概率法。对应的资料和设计方式,最后看 分析目的(这点较难),而后选择合适的 统计学方法。在统计描述中我们习惯用均数加减标准 差表示,这是针对近似符合正态性的数据实验设计三要素四原则设计类型实验因素:就是在试验研究中,研究者特别关 心的试验条件,并且性质相同的试验条件必须 具备两种或两种以上状态时,这种试验条件才 能被称为试验因素,注意:选择实验因素时,要

5、 尽量排除非实验因素的干 扰。实验对象:根据试验研究的目的和具体情况, 应结合专业知识选择合适的受试对象原则:敏感性、特异性、稳 定性、同质性、依从性、经 济性实验效应:试验效应是试验因素作用于受试对 象的反应和结局,它通过观察指标来体现。原则:客观性、精确性、灵 敏性、稳定性、特异性、关 联性对照:对照原则是指试验设计中通常要设立对 昭组 j、vl L种类:安慰剂对照、空白对 照、试验对照、自身对照、 标准对照随机:随机原则是指采用随机的方式来选取和 分配样本方法:抽签法、查表法、计 算机伪随机数法重复:重复原则指的是在相同试验条件下进行多次独立重复试验,它与样本含量关系密切。均衡:确保试验

6、因素各水平组间不受其他试验因素或重要的非试验因素的不平衡的干扰和影响,以便使所考察的试验因素取不同水平条件下对观测结果 的影响真实地显露出来。单组配对成组单因素多水平进行表示,假如不符合,我们只能使用中位数和四分位数间距一起表示。而且前者优先在假设检验中,能使用参数检验(如 t检验,F检验)优先选择,否则,才选用非参数检验(如秩和检验)平均指标算术平均值:n个性质相同的定量数据之和除 以n所得的结果选择原则:算术平均值适用 于一组性质相同且近似服 从对称分布(最好服从正态 分布)的定量资料极差:一组性质相同的 定量数据中最大值与最小 值之差。四分位间距:将全部数据 四等分,就有三个分位 点,用

7、Q1、Q2 Q3表 示,分别称为第1四分位 数、第2四分位数和第3 四分位数。则 Q3-Q1即为 四分位间距。应用于任何分 布类型的资 料。几何平均值:n个性质相同的定量数据取对数 变换后,按算术平均值计算,然后再求其反对 数所得的结果选择原则:几何平均值适用 于一组性质相同且服从正 偏态分布(最好服从对数正 态分布,即数据取对数变换 后服从正态分布)的定量资 料标准差:方差的算术平方 根叫做标准差标准误:统计量的标准 差,叫做标准误既样本的 标准差变异系数:标准差与算术 平均值之比值(通常以 百 分数形式给出),以下四种,其 资料应近似服 从正态分布当比较两组或 多组定量资料 的离散度大小

8、时,在下面两 种情形下,必 须使用变异系 数:1)当各 组定量资料的 单位不同时; 2)当各组定量 资料的算术平 均值相差悬殊 时。调和平均值:n个性质相同的定量数据取 倒数 变换后,按算术平均值计算,然后 再求其倒数 所得的结果选择原则:调和平均值可应 用于表达一组性质相同呈 极严重止偏态分布(即咼峰 出现在全部数据取值范围 的中心点左边)的定量资料异 的平均水平指标中位数:n个性质相同的定量数据按由小到大 的顺序排列后,居中的数据选择原则:中位数可以应用 于任何定量资料,尤其适用 于包含不完全信息的资料 中。众数:由众数的定义可知,只需找出一组原 始数据中重复出现次数最多的那个数据, 它就

9、 是这组定量资料的众数若定量资料是以原始数据 形式呈现的,则众数可应用 于包含两个或多个相同数 据的疋量资料中;若疋量资 料是用频数分布表呈现的, 则只要各组中的频数不全 是1,就可应用众数。方差:一组性质相同的疋量数据中的母 一个与其算术平均值的 差量的平方和除以 数据个数统计图:统计图用不同 线条和颜色表达不同 事物和对象的统计里, 需要附图例加以说明。图例可放在图的右上 角空隙处或下方中间 位置条图:用若干个细长的矩形条的高度来表达各组数量大小的图形选择原则:适合用来表达 定性变量各水平组中的 数量大小。这种定性变量通常是名义变量,即对 各组在横轴上被放置的前后顺序没有严格要求百分条图:

10、将一个长条的总长度视为 100%,根据整体中各部分所占的百分比,将 它们依次在长条上表示出来,称为百分条图选择原则:百分条图通常反映局部与整体之间的 关系,要求各项之间彼此是有联系的,且各项百 分数之和为100%圆图:是百分条图的另一种表现形式,是用圆的各扇面的面积(严格地说,是依据 圆心角的大小)来表示各组数量的大小选择原则:通常用于反映局部与整体之间的数量 关系,因此,通常用相对数作为统计指标来绘制 圆图,而且,要求各组之合计必须为 100%。绘图 时,所用的观测指标必须是相对数箱式图或盒须图选择原则:适于粗略表达一组定量资料的分布情 况,特别是多组数据分布的比较直方图选择原则:适用于表达

11、一组定量资料的频数分布 情况;把用频数分布表表达的资料用图形方式显 示出来,使各组段上的频数分布情况一目了然散点图选择原则:适用于表达 两个在专业上有联系的定 量指标同时变化的趋势线图:设(ti,yi)代表某种事物或现象在时刻ti的取值为yi,则将各点按时间先 后顺序依次用线段连接起来,所形成的折线就称为线图选择原则:适于表达某种事物或现象 随时间推移 的变化幅度(普通线图)和速度(半对数线图)统计表表达统计分析结果的表格称为统计表。凡是由“文字、数字、线条”等组合而成的 信息集合,选择原则;展示统计数据的结构、分布和主要特征。 它可以避免冗长的文字叙述,使要表达的内容中 心突出、简单明了,便

12、于直观分析和比较定量资料的统计 分析单组单样本t检验:检验样本与总体均数之间是否有差别选择原则:独立性、正态性。N小于60u检验:检验样本与总体均数之间是否有差别选择原则:独立性、正态性。N大于60符号秩和检验:检验样本与总体均数之间是否有差别选择原则:一切分布的定量和定性资料配对配对样本t检验:检验两样本所来自的总体均数差异是否有统计学意义选择原则:独立性、正态性(每对数据的差 值要服从正态分布)Wilcox on符号秩检验:检验两样本所来自的总体分布差异是否有统计 学意义选择原则:一切分布的定量和定性资料成组两样本t检验:检验两样本所来自的总体均数差异是否有统计学意义选择原则:独立性、正态

13、性、方差齐性,n小于60t检验:检验两样本所来自的总体均数差异是否有统计学意义选择原则:独立性、正态性u检验:检验两样本所来自的总体均数差异是否有统计学意义选择原则:独立性、正态性、方差齐性,n大于60F检验:在成组设计时,F=t的平方,既F检验等价于t检验选择原则:独立性、正态性、方差齐性Wilcox on秩和检验:检验两样本所来自的总体分布是否有统计学意义选择原则:一切分布的定量和定性资料单因素多水平F检验:检验各组样本所来自的总体均数差别是否有统计学意义注意:拒绝H0,只能认为各组不完全相等。选择原则:独立性、正态性、方差齐性Kruskal-Wallis H检验:检验各组样本所来自的总体

14、分布差别是否有统计 学意义。注意:拒绝H0,只能认为各组分布不完全相同选择原则:一切分布的定量和定性资料单因素多水平两两 比较LSD法:也称最小显着差异法,适用于一对或几对在专业上有特殊意义 的总体均数间的比较适用于任意两组的比较Bonferroni 法适用于任意两组的比较注意:此时a的显着水平要校正,即a=a/(k*(k-1)Tukey法也称为Tukey-Kramer法或诚头显着性差异(HSD检验适用于任意两组的比较SNK法适用于任意组均数间的两两比较Dunnett t检验法适用于各小组与对应的某个对照组进行比 较般四格表来自横断面研究设计的2X 2表资料检验目的:检验两组分布差异是否有统计

15、学 意义(1)当n 40且所有的T 5时,用c2检验 的基本公式或四格表资料c2检验的专用公式; 当P-a时改用Fisher精确概率法(2)当n 40但有1 40且所有的T 5时,用c2检验 的基本公式或四格表资料c2检验的专用公式; 当P- a时改用Fisher精确概率法(2)当n 40但有 K Tv 5时,用连续性校正公式;(3) 当nv 40,或Tv 1时,用Fisher精确概率法;检验目的:在1的基础上检验RR值与1的差别是否有统计学意义运用MH卡方检验公式计算(1)当n 40且所有的T 5时,用c2检验 的基本公式或四格表资料c2检验的专用公式; 来自病例-对照研究设计的检验目的:1

16、假如只检验两组分布差异是否有统当P-a时改用Fisher精确概率法(2)当n2X 2表资料计学意义40但有1 50时,按下 式计算检验统计量 u:Ken dall等级相关要求;当两个变量都用等级来表示时,用一个 统计量来衡量它们的等级不一致的情况。备注;二者相关系数有统计学意义,只能说 明一者有相关关系,并不能讲 疋一者存 在联系或者说因果关系。简单线性回归资料要求:L线性,1独 立(各观测值取值相互 独立),N正态(针对特 定的x值,y的取值服从 正态),E方差齐性;回归系数:当x变化一个单位时,对因变量 y均值的影响备注:一般要求符和LI即可,只有定量资 料才进行简单线性回归,定性资料没有

17、学, 也没有听说过,有线性关系也只能说在 x 的取值内有线性关系,不能随意扩大 x的 范围多重线性回归资料要求:L线性,1独 立(各观测值取值相互 独立),N正态(针对特 定的x值,y的取值服从 正态),E方差齐性;解释偏回归系数:反映的是当模型中的其他 自变量不变时,其中一个自变量对因变量 丫 的均值的影响。使用软件时要进行变量筛选logistic 回归因变里为一值变里时回归系数B j表示自变量Xj改变一个单位时logitP的改变量直线相关分析的一般步骤:1.绘制散点图,观察两变量的变化趋势;2.若散点图呈直线趋势,计算相关系数;3.对相关系数进行假设 检验;4.必要时对总体相关系数进行区间

18、估计。直线相关分析的注意事项:1.直线相关分析要求两个变量均为服从正态分布的随机变量,实际数据要满足这一前提。2.分析前必须先作散点图,变化不呈直线趋势时不宜作直线相关。3.要注意相关的有效范围。相关系数的意义仅限于原资料中两个变量值的实测范围,超出这一范围就不一定保持现有的直线关系了。4.作相关分析时,必须考虑异常点的影响。5.相关分析要有实际意义,两变量相关并不代表两变量间一定存在内在联系,相关关系不一定是因果关系。有时两个变量虽然存在直线关系,但可能是同时受另外一个因素的影 响,二者均随另一个因素的变化而变化,它们本身却不一定存在因果关系。6.分层资料不宜盲目合并进行相关分析。只有确定各

19、层研究对象具有同质基础才能合并。7.不要把假设检验中相关显着性大小理解为相关程度的大小。若经假设检验推断r 10,说明两变量间存在一定的直线关系。相关的密切程度可参照下面标准判断:|r|为低度相关,w |r| w为中度相关,|r|为高度相关。直线回归分析的一般步骤:1绘制散点图,若呈直线趋势,贝冋拟合直线回归方程;2求回归方程的待定系数:a和b ; 3.写出回归方程4.对回归方程进行假设检验;5.绘制回归直线;6.总体回归系数的区间估计。直线回归分析时的注意事项:1.做回归分析要有实际意义。另外,即使两个变量间存在线性关系,也不一定是因果关系,必须结合专业知识做出合理的解释和结论。2. 直线回

20、归分析的资料,一般要求应变量 Y是来自 正态总体的随机变量,自变量 X可以是正态随机 变量,也可以是精确测量和严密控制的值。3. 应注意自变量或因变量的选取,特别是存在因果联系的变量,避免因果颠倒。4. 进行直线回归分析时,应先绘制散点图,判断有无直线趋势。5. 绘制散点图后,若出现一些特大或特小的离群值 (异常点),则应及时复核检查,对由于测定、记录或计算机录入的错误数据,应予以修正和剔除。6. 应注意回归方程的适用范围,回归直线不宜外延。直线回归的适用范围一般以自变量取值范围为限,在此范围内计算称为内插interpolation);超过自变量取值范围计算称为外延(extrapolation

21、)。若无充足理由证明,超出自变量取值范围后该直线关系仍然成立,应该避免随意外延。直线相关与回归的区别与联系:1.区别(1)资料要求不同:相关要求两个变量呈双变量正态分布;回归要求应变量丫服从正态分布,而自变量X是能精确测量和严格控制的变量。(2)统计意义不同:相关反映两变量间的伴随关系,这种关系是相互的、对等的,不一定有 因果关系;回归则反映两变量间的依存关系,有自变量与应变量之分,一般将“因”或较易测定、变异较小者定为自变量。这种依存关 系可能是因果关系或从属关系。(3)分析目的不同:相关分析的目的是描述两变量间的相互关系,并用一个定量的指标来反映这种关系 的方向和密切程度;回归分析的目的则是描述应变量与自变量间的数量依存关系,从而可以进行统计预测和统计控制。2.联系(1)变量间关系的方向一致:对同一资料,r与b的符号一致。 假设检验等价:对同一样本,tr = tb,实际应用中同一组资料进行相关和回归分析时,只检验其中之一即可。 r与b可互相转换 相关与回归可以相互解释。相关系数的平方 r2等于回归平方和占总平方和的比例,即反映应变量Y的总变异中归因于X的部分。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1