第4章抽样误差与假设检验ppt课件.ppt

上传人:本田雅阁 文档编号:2113183 上传时间:2019-02-15 格式:PPT 页数:23 大小:509.02KB
返回 下载 相关 举报
第4章抽样误差与假设检验ppt课件.ppt_第1页
第1页 / 共23页
第4章抽样误差与假设检验ppt课件.ppt_第2页
第2页 / 共23页
第4章抽样误差与假设检验ppt课件.ppt_第3页
第3页 / 共23页
亲,该文档总共23页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第4章抽样误差与假设检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《第4章抽样误差与假设检验ppt课件.ppt(23页珍藏版)》请在三一文库上搜索。

1、 第四章 抽样误差与假设检验 (Sampling Error and Hypothesis Test) 哈尔滨医科大学 李康 第一节 均数的抽样误差与标准误 一、均数的抽样误差 在医学研究中,绝绝大多数情况是由样样本信息 研究总总体。由于个体存在差异,因此通过样过样 本推 论总论总 体时时会存在一定的误误差,如样样本均数 往往 不等于总总体均数 ,这这种由抽样样造成的样样本均数与 总总体均数的差异称为为抽样误样误 差。对于抽样研究, 抽样误差不可避免。 二、抽样误差的分布 理论论上可以证证明:若从正态总态总 体 中, 反复多次随机抽取样样本含量固定为为n 的样样本,那 么这这些样样本均数 也服

2、从正态态分布,即 的总总体 均数仍为为 ,样样本均数的标标准差为为 。 抽样分布 抽样分布示意图 中心极限定理: 当样样本含量很大的情况下,无论论原始测测量变变量服 从什么分布, 的抽样样分布均近似正态态。 抽样分布 抽样分布示意图 三、标准误(Standard Error) 样本均数的标准差称为标准误。样样本均数的 变变异越小说说明估计计越精确,因此可以用标准误 表示抽样误差的大小: 实际中总体标准差 往往未知,故只能求 得样本均数标准误的估计值 : 例4.1 在某地随机抽查成年男子140人,计算得红 细胞均数4.771012/L,标准差0.38 1012/L ,试计 算均数的标准误。 标准

3、误是抽样分布的重要特征之一,可用于衡 量抽样误差的大小,更重要的是可以用于参数的区 间估计和对不同组之间的参数进行比较。 第二节 总体均数的估计 一、可信区间的概念(Confidence Interval) 区间估计:指按预先给定的概率,计算出一个区间, 使它能够包含未知的总体均数。事先给定的概率 称为可信度,通常取 。 参数估计 点估计:不考虑抽样误差,如 区间估计:考虑抽样误差 二、可信区间的计算 (一) 已知 一般情况 其中 为标准正态分布的双侧界值。 可信区间: 标准正态分布 (二) 未知 通常未知,这时可以用其估计量S 代替,但 已不再服从标准正态分布,而是服 从著名的 t 分布。

4、图4-2 不同自由度的 t 分布图 可信区间的计算: 计算可信区间的原理与前完全相同,仅仅是两 侧概率的界值有些差别。即 可信区间: 需要注意:在小样本情况下,应用这一公式的 条件是原始变量服从正态分布。在大样本情况下 (如n100),也可以用 替换 近似计算。 例4.2 某医生测得25名动脉粥样硬化患者血浆 纤维蛋白原含量的均数为3.32 g/L,标准差为0.57 g/L,试计算该种病人血浆纤维蛋白原含量总体均数 的95%可信区间。 下限: 上限: 例4.3 试计算例4.1中该地成年男子红细胞总体 均数的95%可信区间。 本例属于大样本,可采用正态近似的方法计算 可信区间。因为 ,则95%可

5、 信区间为: 下限 : 上限 : 三、模拟实验 模拟抽样成年男子红细胞数。设定: 产生100个随机样本,分别计算其95%的可信区间, 结果用图示的方法表示。从图可以看出:绝大多数 可信区间包含总体参数 ,只有6个可信区间 没有包含总体参数(用星号标记)。 图4-2 模拟抽样成年男子红细胞数100次的95%可信区间示意图 * * * * * 第三节 假设检验的意义和步骤 (Hypothesis Test) 统计统计 推断的另一个重要内容,目的是通过样 本数据比较总较总 体参数之间间有无差别别。 一、假设检验设检验 的基本思想 例4.4 使用黑加仑油软胶囊治疗高脂血症, 30名高脂血症患者治疗前后

6、血清甘油三酯检测结 果的差值为1.380.76 (g/L),问治疗后血清甘 油三酯是否有所改善? 样 本 治疗前后甘油三 酯的变化(差值 ) 问题归纳: 样本疗效 药物作用 + 机遇 对上面问题可以作如下考虑: 问题: 究竟多大能够下“有效”的结论? 假定治疗前后血清甘油三酯检测结果的差值服从正态分布 ,若 则 服从t 分布。 根据 t 分布能够计算出有如此大差异的概率P ,如果P 值很小,即计算出的t 值超出了给定的界限,则倾向于拒绝 H0,认为治疗前后有差别。 图4-3 利用t 分布进行假设检验原理示意图 二、假设检验的基本步骤 1.建立假设和确定检验水准 无效假设H0(null hypo

7、thesis)指需要检验的假设 ,备择假设H1(alternative hypothesis)指在H0 成立证据不足的情况下而被接受的假设。例如建立 治疗前后血清甘油三酯疗效的无效假设和备择假设 分别为 检验检验 水准 是预预先规规定的拒绝绝域的概率值值, 实际实际 中一般取 。 说明 :备择假设有双侧和单侧两种情况。双侧 检验指不论正方向还是负方向的误差,若显著地超出 检验水准则拒绝H0, 即为双侧检验;单侧 检验指仅在出现正方向或负方向误差超出规定的水准 时则拒绝H0 ,如治疗后血清甘油三酯下降的假设可 表示为 双侧检验和单侧检验应如何选择,需根据研究目的 和专业知识而定。一般情况下,双侧

8、检验侧检验 更为稳为稳 妥 ,因为对为对 相同的样样本,双侧检验侧检验 得出有显显著性差别别 的结论结论 ,单侧检验单侧检验 也一定是显显著的。 2.选择检验方法和计算检验统计量 根据资料类型、研究设计方案和统计推断的目的 ,选择适当的检验方法,不同检验方法各有其相应的 检验统计量及计算公式。许多假设检验方法是以检验 统计量来命名的,如 t 检验、u检验、F检验和 检 验等。 3.确定P 值并做出统计推断结论 查表得到检验用的临界值,然后将算得的统计量 与拒绝域的临界值作比较,确定P 值。如对双侧 t 检 验 ,则 ,按检验水准 拒绝H0。 小 结 1.总总体参数值值在现实现实 中通常不能获获

9、得,而是通过过 随机样样本来进进行估计计。由于个体存在差异,因此通 过样过样 本推论总论总 体时时会存在一定的误误差,这这种由抽 样样造成的样样本均数与总总体均数的差异称为为抽样误样误 差 。抽样误样误 差的大小可以用标准误进行衡量。 2.参数估计计有点估计计和区间间估计计两种方式。点估 计计的重要表达方式是平均值;区间间估计计是指按预预先 给给定的概率,计计算出一个区间间,使它能够够包含未知 的总总体均数。区间间越窄说明估计的准确度越高。 3.总总体均数可信区间间的计计算公式可以利用 的 抽样样分布获获得。一种重要的方法是利用 t 分布计算 区间两端的可信限 。单侧单侧 可信区间间只需 将公

10、式中的双侧侧界值换值换 成单侧单侧 界值值。 4.假设检验设检验 的思想是,首先对对所需要比较较的总总 体提出一个无差别的假设设,然后通过样过样 本数据去推 断是否拒绝这绝这 一假设设。其实质实质 是判断观观察到的“ 差别别”是抽样误样误 差引起还还是总总体上的不同,目的是 评价两个不同的参数或两种不同处理引起效应不同 的证据有多强,这种证据的强度用概率P 度量和表 示。 5.假设检验设检验 有三个基本步骤骤: 建立假设和确定检验水准,通常选 选择检验选择检验 方法和计计算检验统计检验统计 量 确定P 值值和做出统计统计 推断结论结论 所有的假设检验都按照这三个步骤进行,各种 检验方法的差别在于第步计算的检验统计量不同 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1