4-正态分布及其应用.ppt

上传人:本田雅阁 文档编号:3467054 上传时间:2019-08-29 格式:PPT 页数:41 大小:949.52KB
返回 下载 相关 举报
4-正态分布及其应用.ppt_第1页
第1页 / 共41页
4-正态分布及其应用.ppt_第2页
第2页 / 共41页
4-正态分布及其应用.ppt_第3页
第3页 / 共41页
4-正态分布及其应用.ppt_第4页
第4页 / 共41页
4-正态分布及其应用.ppt_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《4-正态分布及其应用.ppt》由会员分享,可在线阅读,更多相关《4-正态分布及其应用.ppt(41页珍藏版)》请在三一文库上搜索。

1、医学统计学 王友洁 email 正态分布及其应用 Normal distribution 主要内容 l正态分布的概念及其特征 l标准正态分布 l医学参考值范围及其制定 一 正态分布 (normal distribution) 某地140名正常男子红细胞数的频数表 红细红细 胞数频频 数 频频 率(%) 累积频积频 率(%) 3.80 2 1.4 1.4 4.00 6 4.3 5.7 4.20 11 7.9 13.6 4.40 25 17.9 31.5 4.60 32 22.9 54.4 4.80 27 19.3 73.7 5.00 17 12.1 85.8 5.20 13 9.3 95.1

2、5.40 4 2.9 98.0 5.60 2 1.4 99.4 5.80 6.00 1 0.7 100.0 合计计140 - 100.0 140名正常男子红细胞计数的直方图 频 数 f 红细胞数X 频 率 密 度 频率/组距 直方图形状相同,使各直方的面积相应于频率,其和为1(100%) 某地成年男子红细胞数的分布逐渐接近正态分布示意图 一、正态分布(Normal Distribution) 频率密度 正态分布的概念 又称为Gauss分布(Gaussian distribution)。当原始数据的频数 分布图的观察人数逐渐增加且组段 不断分细时,图中的直条就不断变 窄,其顶端则逐渐接近于一条光

3、滑 的曲线。这条曲线形态呈钟形,两 头低、中间高,左右对称,近似于 数学上的正态分布。在处理资料时 ,我们就把它看成是正态分布。 正态分布曲线的数学函数表达式 l如果随机变量X的分布服从概率密度函数 l则称X服从正态分布,记作XN(,2), 为X的总 体均数,2为总体方差 正态分布有两个参数: 和 , 分别表示均数和标准差 。 二、正态分布的特征 l钟型曲线,以为中心,左右完全对称 ,两端与X轴永不相交 l在X=处,f(X)取最大值,X越远离, f(X)越小。 l曲线下面积分布有规律 lX轴与正态曲线所夹面积恒等于1 或100%; l区间的面积为68.3%,区间 1.96的面积为95%,区间

4、2.58的面积为99%. l两个参数决定位置和变异:和 图3-2 正态分布曲线下的面积 图3-3 三种不同均值的正态分布 两个参数决定位置和变异 是位置(即平均水平) 参数,决定分布曲线在横 轴的偏倚位置 l是变异参数,决定分布 曲线的形态 图3-4 三种不同标准差的正态分布 正态分布是一个分布族,对应于不同的参数 和 会产生不同位置、不同形状的正态分布。 sm 为了应用方便, 令 : 二、标准正态分布 (Standard Normal Distribution) 对对任何参数的正态态分布,都可以通过过一个简单简单 的 变变量变换变换 化成 和 的标标准正态态分布 。通常,可以利用标标准正态态

5、分布表求出与原始变变量X 有关的概率值值。此变换变换 也称为标为标 准化变换变换 ,或称 Z 或u变换变换 图3-5 标准正态分布及曲线下面积 l标准正态分布Z的概率密度函数为 l即将XN(,2)的正态分布转化为Z N(0,12)的标 准正态分布,Z称为标准正态变量,其分布函数为 l根据上述公式制成附表1,欲求一定区间标准 正态分布曲线下的面积只需查表即可,且 l (z)=1- (-z) (z) 例:已知X服从均数为标准差为的正态分布,试估计: (1)X取值在区间1.96内的概率; (2)X取值在区间2.58内的概率。 l求X取值在相应区间内的概率,首先要确定区间两端点 所对应的Z值 查表,得

6、(-1.96)=0.025, 则Z取值在(-1.96,1.96) 的概率为0.95,即X取值在区间1.96内的概率为 0.95。 95% 99% 例3-1:正常成年男子的红细胞计数近似服从正态分布,假设均值 为4.781012/L,标准差为0.381012/L,试估计红细胞数在 41012/L以下所占的比例。 l先将4(1012/L)变换为相应的值,即 l于是问题就转化成为求标准正态分布Z值小于-2.05概率 。查附表1得(-2.05)=0.202,表明成年男子的红细胞 数低于4 1012/L的人约占总体的2%。 l求出在4 1012/L5.5 1012/L范围内所占的比 例 l即求P(4.0

7、X5.5) l例3-2 上节课的例题中已计算出101名正常成年女子 的血清总胆固醇均数为4.03mmol/L,标准差为 0.659mmol/L。试估计该单位:正常成年女子血清 总胆固醇在4.00mmol/L以下者占正常女子总人数的 百分比;在4.005.00mmol/L之间者占正常女子总 人数的百分比;在5.00mmol/L以上者占正常女子总 人数的百分比。 由于此例样本含量较大,可用样本均数、标准差代替总 体均数和标准差 查附表1得(-0. 05)=?,如何求(1.47)? 三、正态分布的应用 l正态分布除了可估计频数分布外,还是 许多统计方法的基础,并可应用于质量 控制及制定医学参考值范围

8、。 一、基本概念 l医学参考值:通常指包括绝大多数正常人的解剖、生理、生化、免疫 及组织代谢产物的含量等各种生理生化指标常数。 l医学参考值范围:由于存在个体差异,生物医学数据并非常数而在一 定范围内波动,故采用医学参考值范围作为判定正常和异常的参考标 准。 l主要目的:用于临床疾病诊断。 第三节 医学参考值范围 (Reference Value Range) 通常使用的医学参考值范畴有:90%,95%和99% 。 最常用的是95%参考值范围。 确定95%参考值范围示意图 二、医学参考值范围的制定方法 (一)选择一定数量的参照样本 选择参照样本必须要考虑可能影响所要制定参考值 范围指标的各种疾

9、病及干扰因素,将这些人排除在外。 例如在制定血清谷丙转氨酶活性正常值时,选取正常 人的条件为肝、肾、心、脑、肌肉等无器质性疾患,近 期无特殊用药史等。同时可能需要考虑性别、年龄、民 族、地理位置等因素。样本含量一般要较大,如n120 。 (二)对选定的参照样本进行准确的测定 为保证原始数据可靠,要严格控制检测误差,包括 分析仪器的灵敏度、试剂的纯度、操作技术及标准的掌 握等,同时必须对测量条件做出统一的规定和说明,如 临床化验参考值范围的制定,应对收集样本时的环境和 生理条件(温度、季节、体育活动强度、饮食、妊娠等 ),收集、转运和储藏样品的方法及时间有明确的规定 。 (三)决定取单侧单侧 范

10、围还围还 是双侧侧范围值围值 有些指标如白细胞数过高或过低均属异常(a) ,故 其参考值范围需要分别确定下限和上限,称作双侧。有 些指标如24小时尿糖含量仅在过高(b)、肺活量仅在过 低时为异常(c),只需确定其上限或下限,称作单侧参 考值范围。 (a)白细胞数参考值范围 (b)24小时尿糖参考值范围(c)肺活量参考值范围 (四)选择选择 适当的百分范围围 参考值值的百分范围围应根据资资料的性质质和研究目的 选择,它与诊断阈值有确定的关系。百分范围围的不同 将导致不同的假阳性率和假阴性率。 正常人和病人数据分布重叠 (五)估计计参考值值范围围的界限 参考值值范围围估计计主要有百分位数法和正态态

11、分布法。 1.百分位数法:适用于任何分布类型的资料,尤其是偏态分布资料,要 求样本含量比正态分布法要多(不低于100)。 l计算公式: 双侧1-参考值范围:P/2 P100-/2 单侧1-参考值范围: P 或P100- l双侧95%医学参考值范围是( P2.5 ,P97.5 ),单侧范围是P95以下 (如人体有害物质如血铅)或P5以上(如肺活量) 百分范围围(% ) 单单 侧侧 双 侧侧 下限 上限 下限 上限 95 P5 P95 P2.5 P97.5 99 P1 P99 P0.5 P99.5 参考值范围所对应的百分位数 为该地区50岁60岁女性高血脂诊断与治疗提供参考依据,试估计血清甘 油三

12、脂含量的95%单侧参考值范围。 甘油三脂频频数 累积频积频 数累积频积频 率(%) 0.10 27 27 4.3 0.40169196 31.1 0.70167363 57.6 1.00 94457 72.5 1.30 81538 85.4 1.60 42580 92.1 1.90 28608 96.5 2.20 14622 98.7 2.50 4626 99.4 2.80 3629 99.8 3.10 1630100.0 合计计630 - - 百分范围围(%) 单单 侧侧 双 侧侧 下限 上限 下限 上限 95 P5 P95 P2.5 P97.5 99 P1 P99 P0.5 P99.5 即

13、95%单侧参考值范围为小于2.098mmol/L。 2.正态分布法 l首先要对资料进行正态性检验,且要求样本含量足够大(n100 )。计算公式如下: l双侧1-参考值范围: l单侧1-参考值范围: 百分范围围(%) 单单 侧侧 双 侧侧 下限 上限 下限 上限 95 99 参考值范围所对应的正态分布区间 参考值值范围围(%)单侧单侧双侧侧 800.841.28 901.281.64 951.641.96 992.332.58 Z界值表 若已算得某地正常成年男子红细胞数的均数为 4.781012/L,标准差为0.381012/L, 试估计该地成 年男子红细胞数的95%参考值范围。 下限: 上限:

14、 小 结 1.标标准差与均数结结合能够够完整地描述一个正态态 分布。对任何参数的正态分布,都可以通过一个简 单的变量变换化成标准正态分布。 2.利用正态态分布可以很容易地确定其数值值出现现 在任意指定范围围内的概率。 3.医学参考值值范围围指“正常参照人群”的解剖、生理、生化、 免疫及组织组织 代谢产谢产 物的含量等各种数据的波动动范围围。主要用作划分 正常人与异常人的界线线。 4.医学参考值值范围围的制定需要按照一定步骤进行。实际实际 中最好 结结合正常人和病人的数据分布特点,权权衡假阳性和假阴性的比例, 选择选择 一个适当的百分范围围,最常用的百分界限是95%。 5.参考值值范围围估计计的方法有多种,其中最基本的有百分位数法 和正态态分布法。正态法的优点是结果较稳定,但对资料要求严格; 百分位数法适合于任何分布类型的资料,但要求大样本。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1