正态分布及标准误.ppt

上传人:rrsccc 文档编号:8792215 上传时间:2021-01-15 格式:PPT 页数:48 大小:662KB
返回 下载 相关 举报
正态分布及标准误.ppt_第1页
第1页 / 共48页
正态分布及标准误.ppt_第2页
第2页 / 共48页
正态分布及标准误.ppt_第3页
第3页 / 共48页
正态分布及标准误.ppt_第4页
第4页 / 共48页
正态分布及标准误.ppt_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《正态分布及标准误.ppt》由会员分享,可在线阅读,更多相关《正态分布及标准误.ppt(48页珍藏版)》请在三一文库上搜索。

1、第四节 正态分布及标准误,本次课要点:,1、熟悉正态分布、标准正态分布的概念;掌握其主要特征及其应用; 2、掌握医学参考值的概念及其范围的制定方法。 3、了解均数标准误的意义及计算 4、掌握总体均数可信区间的概念及计算方法,第四节 正态分布 (normal distribution),一、正态分布的概念 1. 图形,高峰位于中央(均数所在处)、两侧逐渐降低且左右对称、不与横轴相交的光滑曲线。正态分布是一种重要的连续型分布。,正态曲线(normal curve)在横轴上方均数处最高; 正态分布以均数为中心,左右对称; 正态分布有两个参数,即均数与标准差,常用 N(,)表示,用N(0,1)表示标准

2、正态分布。其位置与均数有关,形状与标准差有关。标准差大,离散程度大,正态分布曲线则“胖”,反之,则“瘦”; 正态分布的面积分布有一定的规律性。,二 正态分布分布曲线的特征,三 正态曲线下面积的分布规律,统计学家求出了标准正态分布从- 到(-u)的面积。实际工作中经常要用的面积分布规律有以下三点:,三 正态曲线下面积的分布规律,正态曲线下的面积规律,-1.96,+1.96,2.5%,2.5%,95%,正态曲线下的面积规律,正态曲线下的面积规律,-2.58,+2.58,0.5%,0.5%,99%,三、正态分布的应用,1. 估计参考值范围; 2. 估计总体参数的可信区间; 3. 差异显著性检验; 4

3、. 质量控制。,1、估计频数分布,出生体重低于2500g为低体重儿,某市婴儿出生体重均数3200g,标准差为s=350g。设该资料服从正态分布,试求该地低体重儿占该地所有出生婴儿的比例。,计算:,首先计算标准离差: 查标准正态分布表: (-2)=0.0228 结果:估计低体重儿的比例为2.28%.,参考值范围(reference interval),参考值范围又称正常值范围(normal range)。 什么是参考值范围: 是绝大多数正常人的某观察指标所在的范围。 绝大多数:90%,95%,99%等等。 确定参考值范围的意义: 用于判断正常与异常。 “正常人”的定义: 排除了影响所研究的指标的

4、疾病和有关因素的同质的人群。,参考值范围确定的原则,选定足够例数的同质的正常人作为研究对象 控制检测误差 判断是否分组(性别,年龄组) 单、双侧问题 选择百分界值(90%,95%) 确定可疑范围,参考值范围的估计方法:正态分布法,2.5%,2.5%,95%,-1.96,+1.96,参考值范围的估计方法:百分位数法,P2.5,P97.5,95%参考值范围的估计方法,方法双侧 单侧下限单侧上限 正态分布法 百分位数法 P2.5P97.5 P5 P95,例:参考值范围的计算,某地调查了200名成年女子的平均血清总蛋白为73.5(g/L),标准差3.9 (g/L),试估计该地成年女子血清总蛋白95的参

5、考值范围。 由得95参考值范围: 下限: 1.96s=73.51.963.9=65.9(g/L) 上限: 1.96s=73.51.963.9=81.1(g/L) 此可作为判断该地区成年女子血清总蛋白含量正常与否的参考值。,单侧与双侧参考值范围,根据医学专业知识确定! 双侧:白细胞计数,血清总胆固醇, 单侧:上限: 转氨酶,尿铅,发汞 下限: 肺活量,IQ,,第五节 均数的抽样误差及应用,一、概念 误差:实测值与真值之差。 (1)系统误差:在收集资料过程中产生的误差,值恒定不变,遵循一定的规律变化。 (2)随机误差:一类不恒定、随机、变化的误差。如抽样误差。 2. 抽样:从总体中获得有代表性样本

6、的过程。 3.均数的抽样误差: 由抽样而造成的样本均数与总体均数的差异或各样本均数的差异。,抽样误差的定义,假如事先知道某地七岁男童的平均身高为119.41cm。为了估计七岁男童的平均身高(总体均数),研究者从所有符合要求的七岁男童中每次抽取100人,共计抽取了三次。,抽样误差的定义,三次抽样得到了不同的结果,原因何在?,【定义】由于个体变异的存在,在抽样研究中产生样本统计量和总体参数之间的差异,称为抽样误差。 各种参数都有抽样误差,这里我们以均数为研究对象,抽样误差的定义,计算公式,反映均数抽样误差大小的指标。样本均数的标准差。标准误越小,说明样本均数与总体均数越接近,样本均数的代表性越好,

7、意义,二、标准误,例:对某地成年男性红细胞数的抽样调查中,随机抽取了100名成年男性,调查得到其均数是5.38 /L ,标准差为0.44 /L,求其标准误。 依题意,n=100;s=0.441012/L。 计算得到标准误为:,例题:,(1012/L),标准误的意义,反映了样本统计量(样本均数,样本率)分布的离散程度,体现了抽样误差的大小。 标准误越大,说明样本统计量(样本均数,样本率)的离散程度越大,即用样本统计量来直接估计总体参数越不可靠。反之亦然。 标准误的大小与标准差有关,在例数n一定时,从标准差大的总体中抽样,标准误较大;而当总体一定时,样本例数越多,标准误越小。说明我们可以通过增加样

8、本含量来减少抽样误差的大小。,样本均数的抽样分布规律,中心极限定理 从均数为,标准差为的正态总体中随机抽样,样本均数服从均数为,标准差为 的正态分布。 从均数为,标准差为的任意总体中随机抽样,当样本含量足够大时,样本均数近似服从均数为,标准差为 的正态分布。,t分布的演化,根据中心极限定理的内容,当样本含量足够大时,对从均数为,标准差为的任意总体中随机抽样所得的样本均数进行标准化变换,有,t分布的演化,由于总体标准差往往是未知的,此时往往用样本标准差代替总体标准差, 这里,为自由度,取值为n-1 由W.S. Gosset提出,t分布的图形,自由度分别为1、5、 时的 t 分布,t分布的性质,t

9、分布为一簇单峰分布曲线,高峰在0的位置上,说明从正态总体中随机抽样所得样本计算出的t值接近0的可能性较大。 t分布以0为中心,左右对称。 分布的高峰位置比 u 分布低,尾部高。 t分布与自由度有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。 每一自由度下的t分布曲线都有其自身分布规律。t界值表 。,t界值表,单侧: P(t =t,)= 双侧: P(t =t,)= 即:P(-t,t t,)= 1- 例 查t界值表得t值表达式 t 0.05,10=2.228 (双侧) t 0.05,10=1.812 (

10、单侧),统计推断,所谓统计推断(statistical inference),是指如何抽样,以及如何用样本性质推断总体特征。 参数估计(parameter estimation) 点估计 区间估计 假设检验(hypothesis testing),参数估计之一:点估计,用样本统计量作为总体参数的估计 例如: 用样本均数作为总体均数的一个估计,点估计的缺陷,区间估计,可信区间的定义 总体均数之可信区间的求解 可信区间的要素 正确理解可信区间的含义,区间估计,【例4.1】 随机抽取某地25名正常成年男子,测得该样本的脉搏均数为73.6次/分,标准差为6.5次/分,估计正常成年男子脉搏总体均数。,区

11、间估计的实质,假设某个总体的均数为,需要找到两个量A和B,使得在一个比较高的可信度下(如95%),区间(A,B)能包含。即 P(AB)=0.95,可信区间的定义,按一定的概率或可信度(1-)用一个区间来估计总体参数所在的范围,该范围通常称为参数的可信区间或者置信区间(confidence interval,CI),预先给定的概率(1-)称为可信度或者置信度(confidence level),常取95%或99%。 可信区间(CL, CU )是一开区间 CL、CU 称为可信限,均数的(1-)100%可信区间,1-,均数的95%可信区间,样本含量不是很大时, 样本含量较大时,t分布逼近u分布,例:

12、,【例4.1】 随机抽取某地25名正常成年男子,测得该样本的脉搏均数为73.6次/分,标准差为6.5次/分,求该地正常成年男子脉搏总体均数95%的可信区间。 【例4.2】 某市2001年120名7岁男童的身高=123.62(cm),标准差s=4.75(cm),计算该市7岁男童总体均数90%的可信区间。,可信区间的两个要素,可信度(Confidence):准确性,可靠性,即1-。 一般取90%,95,可人为控制 精确性(Precision):区间的大小,越小越好。 必须二者兼顾,95%可信区间的含义,按这种方法构建的可信区间,理论上平均每100次,有95次可以估计到总体参数。,下列说法正确吗?,算得某95%的可信区间,则: 总体参数有95%的可能落在该区间。 有95%的总体参数在该区间内。 该区间包含95%的总体参数。 该区间有95%的可能包含总体参数。 该区间包含总体参数,可信度为95%。, ,概念辨析,标准差标准误 个体变异 抽样误差 参考值范围 可信区间 变量分布 抽样分布,作业:,简述标准差和标准误的区别和联系 简述参考值范围与均数的可信区间的区别和联系,谢谢 再见,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1