第五章假设检验研.ppt_三一文库31doc.com

资源描述

《第五章假设检验研.ppt》由会员分享，可在线阅读，更多相关《第五章假设检验研.ppt（62页珍藏版）》请在三一文库上搜索。

1、Chapter 7 Hypothesis Testing,流行病与卫生统计学教研室胡利人,主要内容,Hypothesis Testing,Health Statistics,假设检验与区间估计的比较,假设检验应注意的问题,单侧检验与双侧检验,型错误与型错误,假设检验的基本思想与步骤,2,第一节假设检验的基本思想及步骤,Hypothesis Testing,3,Health Statistics,是奶加到茶里，还是茶加到奶里？,假设：她没有这种分辨能力，是碰巧猜对的！ 1次实验，正确，结论？ 0.5 2次实验，正确，结论？ 0.52=0.25 5次实验，正确，结论？ 0.55=0.03125

2、 10次实验，正确，结论？ 0.510=0.0009765625 P0.05为小概率事件她真的有这种能力！,Hypothesis Testing,4,Health Statistics,哪一个盒子？,Hypothesis Testing,5,Health Statistics,现从两个盒子中随机取出一个，问这个盒子里是99个白球还是99个红球？,Hypothesis Testing,6,Health Statistics,假设：这个盒子里有99个白球！现从中随机摸出一个球，发现是红球，此时应如何下结论？,Hypothesis Testing,7,Health Statistics,如果盒中有

3、99个白球，摸出红球的概率只有1/100，这是小概率事件小概率事件在一次实验中发生的可能性很小或可认为不发生现在竟然发生了，从而怀疑所作假设的真实性，认为该盒中所装的为99个红球,Hypothesis Testing,8,Health Statistics,推理方法：带概率性质的反证法，小概率反证法与一般反证法相比，有相同也有不同思路相同，但一般反证法所得结论是绝对成立的，而小概率反证法所得结论具有概率性质，即可能正确也可能犯错误,Hypothesis Testing,9,Health Statistics,【例7-1】为了解某地1岁婴儿的血红蛋白浓度，某医生从该地随机抽取了1岁婴儿2

4、5名，测得其血红蛋白浓度的平均数为123.5g/L,标准差为11.6 g/L，而一般正常小儿的平均血红蛋白浓度为125 g/L，故认为该地1岁婴儿的平均血红蛋白浓度低于一般正常小儿的平均血红蛋白浓度。,Hypothesis Testing,10,Health Statistics,【问题7-1】（1）该结论是否正确？为什么？（2）如何解决此类问题？,Hypothesis Testing,11,Health Statistics,Hypothesis Testing,12,Health Statistics,抽样误差造成,确有差别,Hypothesis Testing,13,Health S

5、tatistics,并不知道该地1岁婴儿总体和一般婴儿总体是否为同一个总体,假设检验的基本思想,假设=0 在假设成立条件下，得到现在结果或更极端结果的可能性有多大？如果可能性很小（小概率事件），在一次试验中本不该得到，现在居然得到了，说明我们的假设有问题，拒绝之；如果有可能得到现在的结果，故根据现有的样本无法拒绝事先的假设（没理由拒绝原来的假设）,Hypothesis Testing,14,Health Statistics,Hypothesis Testing,15,Health Statistics,Hypothesis Testing,16,Health Statistics,常未知，

6、,罚球命中率90以上,Hypothesis Testing,17,Health Statistics,红楼梦中的掷骰子：,Hypothesis Testing,18,Health Statistics,Hypothesis Testing,19,Health Statistics,大观园群芳掷骰子顺序、点数表,曹雪芹写这回时是事先确定了每一轮的人选，并为他们设计了签子及诗句，以作为此人命运的写照和伏笔，再按照座次人物的顺序人为地确定摇出的点数八次结果有六次为小概率事件，其中晴雯的五点和香菱的六点发生的概率分别为0.0031和0.0077，点数有些离谱！,Hypothesis Testing,

7、20,Health Statistics,假设检验的基本步骤,建立检验假设，确定检验水准原假设（零假设，记为H0）备择假设（记为H1）,Hypothesis Testing,21,Health Statistics,Hypothesis Testing,22,Health Statistics,检验假设针对总体，而非针对样本 H0 和 H1 是相互联系、对立的假设，缺一不可 H0通常为：总体服从于某种分布、两个或多个总体参数相等、两个或多个总体分布相同等 H1通常为：总体不服从于某种分布、两个或多个总体参数不等或不全相等、两个或多个总体分布不同或不全相同等,H1 的内容反映了检验的单双侧。

8、若 H1 为 0 或 0，则为单侧检验(one-sided test)。若 H1 为 0，则为双侧检验(two-sided test),Hypothesis Testing,23,Health Statistics,Hypothesis Testing,24,Health Statistics,检验水准(size of a test) ：又称水准，是预先规定的概率值，它确定了小概率事件的标准。实际工作中常取 = 0.05,Hypothesis Testing,25,Health Statistics,选择检验方法、计算检验统计量根据分析目的、资料类型、设计类型、样本大小、方法的适用条件等

9、选择相应的检验方法并计算检验统计量所有检验统计量都是在假设 H0 成立的条件下计算出来的，它是用于决定是否拒绝 H0 的统计量，其统计分布在统计推断中至关重要,Hypothesis Testing,26,Health Statistics,确定 P 值，作出推断结论根据算出的检验统计量如 t、z 值，查相应的界值表，即可得到概率 P，然后将P值与事先规定的检验水准进行比较而得出结论,Hypothesis Testing,27,Health Statistics,一般来说，推断结论应包括统计结论与专业结论两部分 P ，按水准，拒绝 H0 ，接受 H1 ，差异有统计学意义（统计结论），可认为

10、不同或不等（专业结论） P ，按水准，不拒绝H0 ，差异无统计学意义，尚不能认为不同或不等,Hypothesis Testing,28,Health Statistics,29,建立检验假设，确定检验水准,确定P值,计算检验统计量,作推断结论,假设检验步骤,小结,假设检验处理的是有关总体的假设假设检验要判断的是样本数据是否提供了不利于假设的证据如果假设成立时很少会发生的结果发生了，就是假设不成立的证据！用概率来衡量证据的强度，概率越小拒绝原假设的证据越强,Hypothesis Testing,30,Health Statistics,第二节 I型错误和II型错误,Hypothesis

11、Testing,31,Health Statistics,【问题7-2】上述结论是否正确？为什么？【分析】上述结论不正确。假设检验的结论不是绝对正确的，可能犯错误,Hypothesis Testing,32,Health Statistics,一、I型错误和II型错误的概念,I型错误（type I error）： H0实际上是成立的，但由于抽样的原因，拒绝了H0 ，这类“弃真”的错位称为I型错误，其最大概率为,Hypothesis Testing,33,Health Statistics,II型错误（type II error）： H0实际上不成立，但假设检验没有拒绝它，这类“存伪”的错

12、误称为II型错误，其概率大小用表示,Hypothesis Testing,34,Health Statistics,Hypothesis Testing,35,Health Statistics,I型错误和II型错误,法官的审判如法官判定一个人是否犯罪，首先是假定他“无罪”（H0），然后通过侦察寻找证据，如果证据充分则拒绝 “无罪”的假定（H0），判嫌疑人有罪；否则只能暂且认为“无罪”的假定（H0）成立,Hypothesis Testing,36,Health Statistics,Hypothesis Testing,37,Health Statistics,法官的审判,二、I型错误和II

13、型错误的关系,Hypothesis Testing,38,Health Statistics,Hypothesis Testing,39,Health Statistics,Hypothesis Testing,40,Health Statistics,Hypothesis Testing,41,Health Statistics,Hypothesis Testing,42,Health Statistics,当n固定时，增大，减小；反之亦然若欲同时减小与，则只有增大样本含量,Hypothesis Testing,43,Health Statistics,不可能同时犯I型错误和II型错

14、误当P ，拒绝H0，接受H1时，只可能犯I型错误当P ，不拒绝H0时，只可能犯II型错误,Hypothesis Testing,44,Health Statistics,三、检验功效,1 称为检验效能或把握度(power of a test)，其统计学意义是若两总体确有差别，按水准能检出其差别的能力如1- =0.90，意味着若两总体确有差别，则理论上在100次检验中，平均有90次能够得出有统计学意义的结论,Hypothesis Testing,45,Health Statistics,影响检验效能的因素：两总体参数的真实差异总体标准差 I型错误样本含量n,Hypothesis Te

15、sting,46,Health Statistics,第三节单侧检验与双侧检验,双侧检验 H0 : 12 H1 : 12 单侧检验 H0 : 12 H0 : 12 H1 : 1 2 H1 : 1 2,Hypothesis Testing,47,Health Statistics,单侧检验与双侧检验的关系双侧检验得P，单侧检验必得P，则双侧检验必得P 若选择单侧检验是恰当的，显然其检验效能高于双侧检验；若误用单侧检验较容易犯I型错误；若误用双侧检验较容易犯II型错误,Hypothesis Testing,48,Health Statistics,单、双侧检验与单、双尾面积假设检验的单、双侧

16、与检验中涉及的单、双尾面积既有密切联系, 又有不同的涵义, 尤其要注意它们之间在各方法中固有的对应关系单、双侧检验与单、双尾面积符合一致的情况只存在于某些方法（如z检验法、t 检验法等) , 并非广泛存在双侧检验对应单尾面积（方差分析、卡方检验）；方差齐性检验对应特殊的“双尾”面积， ,“双尾” 非但不对称, 而且分属于两条不同的F 分布曲线,Hypothesis Testing,49,Health Statistics,单侧检验与双侧检验的选择检验的单双侧必须依据专业知识和研究目的在设计时确定，而不能在确定P值时主观选择,Hypothesis Testing,50,Health Sta

17、tistics,Hypothesis Testing,51,Health Statistics,第四节假设检验应注意的问题,Hypothesis Testing,52,Health Statistics,应有严密的研究设计同质总体随机抽样组间可比性,Hypothesis Testing,53,Health Statistics,正确理解检验水准和P值的意义 P值是指从H0总体中随机抽样，获得等于或大于（等于或小于）现有统计量值的概率。从另一个角度讲，P值反映了实际观测到的数据与 H0之间不一致的程度，P值越小，说明实际观测到的数据与H0之间不一致的程度越大，越有理由拒绝H0 拒绝H0

18、时所冒的风险,Hypothesis Testing,54,Health Statistics,在假设检验之前人为规定犯第一类错误的概率,说明拒绝H0所冒的风险不可超过,Hypothesis Testing,55,Health Statistics,正确理解结论的统计学意义差异有统计学意义是指样本统计量之间的差值并非仅由抽样误差所偶然获得，而是由本质差别造成的，故被推断的两总体参数有差别，至于其差值幅度算不算大，是否“明显”或“更显著”等结论性的判断，完全属于专业方面的分析，假设检验本身得不出此结论,Hypothesis Testing,56,Health Statistics,差异尚无统计

19、学意义是指样本统计量之间的差值仅由抽样误差所偶然获得的可能性较大，故尚不能认为被推断的两总体参数有差别。但不应误解为差别不大或肯定无差别有统计学意义并不等于有实际临床意义，还应结合专业知识来分析,Hypothesis Testing,57,Health Statistics,假设检验的结论不能绝对化统计结论的概率性：无论做出何种推断结论，总是有风险的！尤其是检验统计量位于检验界值的附近时，下结论更应慎重统计学已证明由此可以肯定,Hypothesis Testing,58,Health Statistics,第五节假设检验与区间估计的区别与联系,可信区间用于说明量的大小，即推断总体均数的范围假设检验用于推断质的不同，即判断两总体均数是否不同,Hypothesis Testing,59,Health Statistics,可信区间亦可回答假设检验的问题可信区间包含H0，按水准，不拒绝H0；若不包含H0，则按水准，拒绝H0，接受H1 可信区间比假设检验可提供更多的信息可信区间不但能回答差别有无统计学意义，而且还能提示差别有无实际的专业意义,Hypothesis Testing,60,Health Statistics,Health Statistics,61,Thank You !,

展开阅读全文