t检验假设检验.ppt_三一文库31doc.com

资源描述

《t检验假设检验.ppt》由会员分享，可在线阅读，更多相关《t检验假设检验.ppt（62页珍藏版）》请在三一文库上搜索。

1、t 检验问题提出,假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同；医疗卫生实践中最常见的是计量资料两组比较的问题； t检验 (t test, student t test)和u检验(u test)是用于计量资料两组比较的最常用的假设检验方法,t 检验和 u 检验应用条件： t 检验：1.单因素设计的小样本（n50）计量资料 2.样本来自正态分布总体 3.总体标准差未知 4.两样本均数比较时，要求两样本相应的总体方差相等 u 检验：1.大样本 2.样本小，但总体标准差已知,t 检验,根据研究设计t检验可由三种形式：单个样本的t检验

2、配对样本均数t检验(非独立两样本均数t检验) 两个独立样本均数t检验,单个样本t检验,又称单样本均数t检验(one sample t test),适用于样本均数与已知总体均数0的比较,其比较目的是检验样本均数所代表的总体均数是否与已知总体均数0有差别。已知总体均数0一般为标准值、理论值或经大量观察得到的较稳定的指标值。单样t检验的应用条件是总体标准未知的小样本资料( 如n50),且服从正态分布。,单个样本 t 检验原理,已知总体,0,未知总体,样本,在 H0 : = 0的假定下，可以认为样本是从已知总体中抽取的，根据t分布的原理，单个样本t检验的公式为：,自由度n-1,单个样本t检验实例

3、分析,例5.1 以往通过大规模调查已知某地新生儿出生体重为3.30kg.从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42kg,标准差为0.40kg,问该地难产儿出生体重是否与一般新生儿体重不同? 本例已知总体均数0=3.30kg，但总体标准差未知,n=35为小样本,，S=0.40kg，故选用单样本t检验。,单个样本t检验检验步骤,1. 建立检验假设，确定检验水准 H0：0，该地难产儿与一般新生儿平均出生体重相同; H1：0，该地难产儿与一般新生儿平均出生体重不同; 0.05。 2. 计算检验统计量在=0成立的前提条件下，计算统计量为：,3. 确定P值，做出推断结论本例

4、自由度n-135-134，查附表2，得t0.05/2,34=2.032。因为t t0.05/2,34，故P0.05，按 0.05水准不拒绝H0，差异无统计学意义，根据现有样本信息，尚不能认为该地难产儿与一般新生儿平均出生体重不同。,小结假设检验的思想是，首先对所需要比较的总体提出一个无差别的假设，然后通过样本数据去推断是否拒绝这一假设。其实质是判断观察到的“差别”是抽样误差引起还是总体上的不同，目的是评价两个不同的参数或两种不同处理引起效应不同的证据有多强，这种证据的强度用概率P 度量和表示。假设检验有三个基本步骤：建立假设和确定检验水准，通常选选择检验方法和计算检验统计量确定P

5、值和做出统计推断结论所有的假设检验都按照这三个步骤进行，各种检验方法的差别在于第步计算的检验统计量不同。,练习根据大量调查，已知健康成年男子脉搏的均数为72次/分钟。某医生在一山区随机调查了25名健康成年男子，求得其脉搏均数为74.2次/分钟，标准差为6.0次/分钟，能否据此认为该山区成年男子的脉搏数高于一般？,（1）建立假设，确定检验水准,H0: 0, 即该山区成年男子的平均脉搏数与一般成年男子脉搏数相等,H1: 0,即该山区成年男子的平均脉搏数高于一般成年男子脉搏数单侧0.05,(2) 选定检验方法，计算检验统计量t值,(3) 确定p值，判断结果,以查 t 界值表 0.025P

6、0.05,按=0.05水准，拒绝H0，接受H1，差异有统计学意义。可认为该山区健康成年男子脉搏数高于一般成年男子脉搏数。,第二节配对样本均数t检验,配对样本均数t检验简称配对t检验(paired t test),又称非独立两样本均数t检验,适用于配对设计计量资料均数的比较,其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别。配对设计(paired design)是将受试对象按某些重要特征相近的原则配成对子，每对中的两个个体随机地给予两种处理。,配对设计概述,应用配对设计可以减少实验的误差和控制非处理因素，提高统计处理的效率。配对设计处理分配方式主要有三种情况：两个同质受试对象

7、分别接受两种处理，如把同窝、同性别和体重相近的动物配成一对，或把同性别和年龄相近的相同病情病人配成一对；同一受试对象或同一标本的两个部分，随机分配接受两种不同处理，如例5.2资料；自身对比(self-contrast)。即将同一受试对象处理（实验或治疗）前后的结果进行比较，如对高血压患者治疗前后、运动员体育运动前后的某一生理指标进行比较。,某单位研究饮食中缺乏VE与肝中VA的关系，将同种属的大白鼠按性别相同，年龄、体重相近者配成对子，共8对，并将每对中的两头动物随机分到正常饲料组和VE缺乏组，过一定时期将其处死，测得肝中VA的含量。问不同饲料组大白鼠肝中VA的含量有无差别？,不同饲料组大白

8、鼠肝中VA含量（IU/g）,配对样本均数t检验原理,配对设计的资料具有对子内数据一一对应的特征,研究者应关心是对子的效应差值而不是各自的效应值。进行配对t检验时,首先应计算各对数据间的差值d,将d作为变量计算均数。配对样本t检验的基本原理是假设两种处理的效应相同，理论上差值d的总体均数d 为0，现有的不等于0差值样本均数可以来自d = 0的总体,也可以来d 0的总体。,配对样本均数t检验原理,可将该检验理解为差值样本均数与已知总体均数d（d = 0）比较的单样本t检验.其检验统计量为：,配对样本均数t检验实例分析,例5.2 有12名接种卡介苗的儿童，8周后用两批不同的结核菌素，一批是标准结

9、核菌素，一批是新制结核菌素，分别注射在儿童的前臂，两种结核菌素的皮肤浸润反应平均直径(mm)如表5-1所示，问两种结核菌素的反应性有无差别。,配对样本均数t检验检验步骤,建立检验假设，确定检验水准 H0：d=0，两种结核菌素的皮肤浸润反应总体平均直径差异为0; H1：d0，两种结核菌素的皮肤浸润反应总体平均直径差异不为0; 0.05。计算检验统计量先计算差值d及d2如上表第四、五列所示，本例d = 39， d 2 195。,配对样本均数t检验检验步骤,先计算差数的标准差计算差值的标准误按公式计算，得：,配对样本均数t检验检验步骤,确定 P 值，作出推断结论自由度计算为 =n-1=12

10、-1=11，查附表2，得t0.05(11) = 2.201， t0.01(11) = 3.106，本例t t0.01(11)， P 0.01，按 0.05水准，拒绝H0，接受H1，差异有统计学意义，可认为两种方法皮肤浸润反应结果不同。,第三节两独立样本t检验,两独立样本t 检验(two independent samples t-test)，又称成组 t 检验。适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均数是否相等。完全随机设计是将受试对象随机地分配到两组中，每组对象分别接受不同的处理，分析比较处理的效应。或分别从不同总体中随机抽样进行研究。,第三节两独立样

11、本t检验,两独立样本t检验要求两样本所代表的总体服从正态分布N(1，12)和N(2，22)，且两总体方差12、22相等,即方差齐性(homogeneity of variance, homoscedasticity)。若两总体方差不等,即方差不齐，可采用t检验,或进行变量变换,或用秩和检验方法处理（见第九章）。,两独立样本t检验原理,两独立样本t检验的检验假设是两总体均数相等,即H0：1=2，也可表述为12=0,这里可将两样本均数的差值看成一个变量样本, 差值的标准误是？则在H0条件下两独立样本均数t检验可视为样本与已知总体均数12=0的单样本t检验, 统计量计算公式为,其中,两独立样本t

12、检验原理,Sc2称为合并方差(combined/pooled variance),上述公式可用于已知两样本观察值原始资料时计算,当两样本标准差S1和S2已知时,合并方差Sc2为:,两独立样本t检验实例分析,例5.3 25例糖尿病患者随机分成两组，甲组单纯用药物治疗，乙组采用药物治疗合并饮食疗法，二个月后测空腹血糖(mmol/L)如表5-2 所示，问两种疗法治疗后患者血糖值是否相同？,25例糖尿病患者随机分成两组，甲组单纯用药物治疗，乙组采用药物治疗合并饮食疗法，二个月后测空腹血糖(mmol/L) 问两种疗法治疗后患者血糖值是否相同？,药物治疗,药物治疗合并饮食疗法,1,2,n1=12,=15.

13、21,=10.85,n2=13,甲组,乙组,总体,样本,？,推断,两独立样本t检验检验步骤,建立检验假设，确定检验水准 H0：1=2，两种疗法治疗后患者血糖值的总体均数相同; H1：12，两种疗法治疗后患者血糖值的总体均数不同； 0.05。计算检验统计量,两独立样本t检验检验步骤,代入公式，得:,两独立样本t检验实例分析,按公式计算，算得: 确定P值，作出推断结论两独立样本t检验自由度为 =n1+n2-2=12+13-2=23；查t界值表，t0.05(23)=2.069，t0.01(23)=2.807.,两独立样本t检验实例分析,由于 t0.01(23) t t0.05(23)，0.01

14、 P 0.05，按0.05的水准拒绝H0，接受H1，差异有统计学意义。故可认为该地两种疗法治疗糖尿病患者二个月后测得的空腹血糖值的均数不同。几何均数资料 t 检验，服从对数正态分布，先作对数变换，再作 t 检验。,t 检验应用条件,两组计量资料小样本比较；样本对总体有较好代表性，对比组间有较好组间均衡性随机抽样和随机分组；样本来自正态分布总体，配对t检验要求差值服从正态分布，实际应用时单峰对称分布也可以；大样本时，用u 检验，且正态性要求可以放宽；两独立样本均数t检验要求方差齐性两组总体方差相等或两样本方差间无显著性。,第五节 u 检验,根据数理统计的中心极限定理,不论变量X的分布

15、是否服从正态分布,当随机抽样的样本例数足够大,样本均数服从正态分布其中为原来的总体均数, 为总体标准差为均数标准误标准正态变量为,U 检验原理,当总体标准差已知,或样本量较大(如n50)时样本均数与总体均数比较、配对设计样本均数比较和两独立样本均数比较的假设检验,可以计算检验统计量u值标准正态变量u的界值双侧时, 单侧时所计算的统计量u值与这些界值比较,很容易确定P值和作出推断结论,u0.05/2,u0.01/2,u1.96 P0.05 差异无统计学意义 u1.96 P0.05 差异有统计学意义 u2.58 P0.01 差异有统计学意义,U 检验原理,成组设计的两样本均数比较的统计

16、量u值计算中,两均数差的标准误为统计量u值的计算公式为,U 检验实例分析,例5-4 研究正常人与高血压患者胆固醇含量(mg%)的资料如下,试比较两组血清胆固醇含量有无差别。正常人组高血压组,U 检验实例分析步骤,建立检验假设, 确定检验水平 ,即正常人与高血压患者血清胆固醇值总体均数相同; ,即正常人与高血压患者血清胆固醇值总体均数不同; =0.05,双侧。计算统计量u值将已知数据代入公式,得,U 检验实例分析步骤,确定P值, 作出推断结论本例u=10.402.58,故P0.01,按=0.05水准拒绝H0,接受H1,差异有统计学意义，可以认为正常人与高血压患者的血清胆固醇含量有差别

17、,高血压患者高于正常人。,第六节 t 检验中的注意事项,1. 假设检验结论正确的前提作假设检验用的样本资料，必须能代表相应的总体，同时各对比组具有良好的组间均衡性,才能得出有意义的统计结论和有价值的专业结论。这要求有严密的实验设计和抽样设计,如样本是从同质总体中抽取的一个随机样本,试验单位在干预前随机分组,有足够的样本量等。,第六节 t 检验中的注意事项,2. 检验方法的选用及其适用条件,应根据分析目的、研究设计、资料类型、样本量大小等选用适当的检验方法。 t 检验是以正态分布为基础的，资料的正态性可用正态性检验方法检验予以判断。若资料为非正态分布，可采用数据变换的方法，尝试将资料变换成正态

18、分布资料后进行分析。,第六节 t 检验中的注意事项,3.双侧检验与单侧检验的选择需根据研究目的和专业知识予以选择。单侧检验和双侧检验中的t值计算过程相同，只是t界值不同，对同一资料作单侧检验更容易获得显著的结果。单双侧检验的选择，应在统计分析工作开始之前就决定，若缺乏这方面的依据，一般应选用双侧检验。,第六节 t 检验中的注意事项,4.假设检验的结论不能绝对化假设检验统计结论的正确性是以概率作保证的，作统计结论时不能绝对化。在报告结论时，最好列出概率 P 的确切数值或给出P值的范围，如写成0.02P0.05，同时应注明采用的是单侧检验还是双侧检验，以便读者与同类研究进行比较。当

19、 P 接近临界值时，下结论应慎重。,第六节 t 检验中的注意事项,5.正确理解P值的统计意义 P 是指在无效假设 H0 的总体中进行随机抽样,所观察到的等于或大于现有统计量值的概率。其推断的基础是小概率事件的原理,即概率很小的事件在一次抽样研究中几乎是不可能发生的，如发生则拒绝H0。因此，只能说明统计学意义的“显著” 。,第六节 t 检验中的注意事项,6.假设检验和可信区间的关系假设检验用以推断总体均数间是否相同，而可信区间则用于估计总体均数所在的范围，两者既有联系又有区别。,对于轻度原发性高血压患者进行治疗，一般病人接受治疗后可使舒张压平均降低10mmHg。现提出一种新的治

20、疗方法，对100名患者进行治疗，平均降压12.7mmHg，血压治疗前后变化的标准差为5.6mmHg，能否说新疗法优于标准疗法？,第七节假设检验中两类错误,假设检验是针对H0，利用小概率事件的原理对总体参数做出统计推论。无论拒绝H0还是不拒绝H0，都可能犯错误。,第七节假设检验中两类错误,当H0为真时，检验结论拒绝H0接受H1，这类错误称为第一类错误或型错误（type error），亦称假阳性错误检验水准，就是预先规定的允许犯型错误概率的最大值当真实情况为H0不成立而H1成立时，检验结论不拒绝H0反而拒绝H1，这类错误称为第二类错误或型错误（type error），亦称假阴性错误,第七节

21、假设检验中两类错误,概率大小用表示，只取单侧，一般未知，在已知两总体差值d（如1-2）、和 n 时，才能算出为了更好地理解两类错误的意义，以样本均数与总体均数比较的u 检验来说明设H0: = 0， H1: 0 H0实际上是成立的，但由于抽样误差的存在，偶然得到较大的值（绝对值）以及u 值（绝对值）,第七节假设检验中两类错误,使得，按=0.05的检验水准，拒绝H0，接受H1，结论为0 此时犯型错误，其最大可能概率值为若确实大于0，即H0不成立，H1成立，由于抽样的偶然性，得到较小的值（绝对值）以及u值（绝对值）使得,检验结论不拒绝H0。此时犯型错误，其概率为,型错误与型错误示意图

22、（以单侧u检验为例）,第七节假设检验中两类错误,愈小，愈大；相反，愈大，愈小同时减小型错误和型错误，唯一的方法就是增加样本含量n 1-称为检验效能（power of a test），也称把握度意义为，当两总体确有差别，按检验水准，假设检验能发现其差别（拒绝H0）的能力。和一样，1-只取单侧。,型错误与型错误示意图（以单侧u检验为例）,第七节假设检验中两类错误,假设检验是针对H0，利用小概率事件的原理对总体参数做出统计推论。无论拒绝H0还是不拒绝H0，都可能犯错误。,第七节假设检验中两类错误,当H0为真时，检验结论拒绝H0接受H1，这类错误称为第一类错误或型错误（type error

23、），亦称假阳性错误检验水准，就是预先规定的允许犯型错误概率的最大值当真实情况为H0不成立而H1成立时，检验结论不拒绝H0反而拒绝H1，这类错误称为第二类错误或型错误（type error），亦称假阴性错误,第七节假设检验中两类错误,概率大小用表示，只取单侧，一般未知，在已知两总体差值d（如1-2）、和 n 时，才能算出为了更好地理解两类错误的意义，以样本均数与总体均数比较的u 检验来说明设H0: = 0， H1: 0 H0实际上是成立的，但由于抽样误差的存在，偶然得到较大的值（绝对值）以及u 值（绝对值）,第七节假设检验中两类错误,使得，按=0.05的检验水准，拒绝H0，接受H1，

24、结论为0 此时犯型错误，其最大可能概率值为若确实大于0，即H0不成立，H1成立，由于抽样的偶然性，得到较小的值（绝对值）以及u值（绝对值）使得,检验结论不拒绝H0。此时犯型错误，其概率为,型错误与型错误示意图（以单侧u检验为例）,第七节假设检验中两类错误,愈小，愈大；相反，愈大，愈小同时减小型错误和型错误，唯一的方法就是增加样本含量n 1-称为检验效能（power of a test），也称把握度意义为，当两总体确有差别，按检验水准，假设检验能发现其差别（拒绝H0）的能力。和一样，1-只取单侧。,型错误与型错误示意图（以单侧u检验为例）,计量资料（measurement data):对每个观察对象的观察指标用定量方法测定其数值大小所得的资料，一般有度量衡单位。,计数资料（enumeration data):先将观察对象的观察指标按性质或类别进行分组，然后计数各组的数目所得的资料。,统计资料的类型,等级资料（ranked data ）：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数。,

展开阅读全文

t检验 假设检验.ppt

t检验假设检验.ppt