卫生统计学 第三章平均数与标准差.ppt

上传人:本田雅阁 文档编号:2169278 上传时间:2019-02-25 格式:PPT 页数:25 大小:123.01KB
返回 下载 相关 举报
卫生统计学 第三章平均数与标准差.ppt_第1页
第1页 / 共25页
卫生统计学 第三章平均数与标准差.ppt_第2页
第2页 / 共25页
卫生统计学 第三章平均数与标准差.ppt_第3页
第3页 / 共25页
亲,该文档总共25页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《卫生统计学 第三章平均数与标准差.ppt》由会员分享,可在线阅读,更多相关《卫生统计学 第三章平均数与标准差.ppt(25页珍藏版)》请在三一文库上搜索。

1、第三章 平均数与标准差,第一节 算术均数和几何均数,数值变量资料的统计描述:集中趋势central tendency 和离散趋势tendency of dispersion 平均数average:说明一组观察值(变量值)的集中趋势、中心位置或平均水平。(a measure of location, a measure of central tendency, a mean or an average) 平均数种类:算术均数arithmetic mean、几何均数geometric mean、中位数median、众数mode、调和均数harmonic mean, H,一、算术均数,简称均数mea

2、n。 统计表示:总体的参数用希腊字母表示,样本的统计量用拉丁字母表示 用表示总体均数,用 表示样本均数 (一)不分组资料均数的计算法:直接计算 为避免过于复杂,在求和的范围可看清时对sigma不记上下标(dummy suffix),对x也不加下标 The mean is the sum of the observations divided by the number of observations.,(二)分组资料的均数计算法:频数表法 P20例3-2,步骤: 1、分组和编制频数分布表frequency distribution table 1)找出观察值中最大值、最小值和极差range 2

3、)按极差大小决定组段数、组段和组距class interval:815组,常用极差的1/10取整作组距,组段下限和上限low limit and upper limit应界限分明,无交叉,从下限开始不包括上限,第一组段包括最小,最后组段包括最大观察值 3)列表划记tallying:见P20表3-2。频数表可绘成直方图histogram,2、加权法weighting method x为组中值class mid-value (midpoint)=本组下限与相邻较大组段的下限相加除以2 k 为组数 f 为各组的频数,又称权数weight f 各组频数之总和 fx 为各组组中值与频数乘积之和 计算实例

4、见P21,3、简捷法short-cut method 1)在频数表的基础上,以与最大频数相对应的组中值为假定均数x0, assumed origin 2)列出简捷法计算均数用表, d为各组组中值减去假定均数后除以组距i,假定均数对应d为0,向上依次为-1,-2, 向下依次为1,2, 3)将各行f值与d值 相乘得df,再求df 4)求均数 *: 可以任何一组组中值为假定均数,结果一致,但设在频数最大组或其附近时,计算较简便。计算机更方便,二、几何均数geometric mean,简记为G 1)资料偏态分布,少数数据过分偏大,(各观察值间呈等比关系 ),原始数据进行对数变换后为对称分布,如平均潜伏

5、期、平均抗体滴度等资料 2)公式 P22例3-3,计算抗体滴度的几何均数;该方法计算出的G通常偏小,可在计算反对数前+(lgd)/2,3)几何均数的应用 几何均数常用于等比资料 观察值不能有0 观察值不能同时有正值和负值,若全为负先把负号除掉,最后结果前加负号,第二节 中位数和百分位数,一、median 用M表示: 把变量值按大小顺序排列,居于中间位置的那个数值就是M 适用于:偏态或分布不明的资料 对称分布时接近均数,偏态分布时更合理 (一)未分组资料: P23例3-4,例3-5,(二)分组资料:按频数表计算M 公式: L中位数所在组的下限 W中位数所在组的宽度 f中位数所在组的频数(例数)

6、n总频数 C中位数所在组的前一组的累计频数cumulative frequency,用累计频数百分数法寻找中位数所在的组段:累计频数刚大于n/2的组段 用内插法linear interpolation求中位数 将W等分为f份,从C至n/2的数值长为(W/f)*(n/2 C),L值,累计频数C,n/2,二、百分位数percentile:指将n个观察值从小到大依次排列,再把它分成100等份,对应于r%位的数值即为第r百分位数。通常用Pr 表示。中位数即第50百分位数 (一)不分组资料的计算方法 Pr=x r%(n+1) 当n为150时计算第5百分位数5%(150+1)= 7.55个变量值,如第7个

7、变量为15,第8个变量为17,用内插法求x7.55=15+0.55(17-15)=16.1,P5为16.1,(二)分组资料的计算方法 percentile is estimated by linear interpolation as (三)要计算多个百分位数时亦用图解法:y axis is cumulative relative frequency, x axis is observation (incubation period). see Figure 3-2, P25,中位数和百分位数的应用 1)中位数常用于描述偏态分布资料的集中位置,反映位次居中的观察值的水平,只受居中变量值波动的影

8、响,对称分布时与均数相同 2)百分位数用于描述观察值在某百分位位置时的水平,多个百分位数结合应用可更全面描述分布特征 3)百分位数常用于确定医学参考值范围(reference ranges, 正常值范围) 4)分布中部的百分位数相当稳定,具有较好的代表性,但靠近两端的百分位数只有在样本数足够大时才较稳定。,第三节 标准差 standard deviation,一、标准差的意义: SD是表示一套变量值离散程度的指标,均数与标准差结合,能全面反映一套变量值的分布情况。SD is a measure of variation, scatter, spread or dispersion. 离散程度

9、离均差x-x 考虑正负值变为离均差的平方 考虑观察值的个数则除以n,为方差variance, 考虑到V是观察单位的平方,故开方得SD,由公式可见,当各变量值愈接近均数时,标准差越小,当各观察值远离均数时,标准差越大,所以标准差能说明变量值的离散程度。 二、不分组资料的标准差的计算 用代数的方法将上述公式简化为 P27表3-8计算实例,三、离均差平方和的简化计算 离均差平方和sum of squares about the mean 简记为lxx,即 离均差平方和或离均差积和sum of products计算时,当原始数据比较大时,计算可以减一个数可除一个数,进行简化。,三条规则: 1、原始数据

10、减一个数或加一个数时,离均差平方和或积和数值不变 2、原始数据除以一个数a,则简化值算出的离均差平方和要乘上一个a2才是原有的离均差平方和 3、离均差积和在计算时如将两变量之一(如x),除以一个数a时,则求得之离均差积和要乘以一个a,才是原始数据的离均差积和;如y也同时除以一个数字b,则求得的离均差积和要同时乘以ab,四、分组资料的标准差计算 公式: 计算实例见P29表3-11 五、标准差的应用 1、表示变量值的离散程度 2、概括地估计变量值的频数分布 3、应用于求正常值范围normal range 4、计算标准误 5、质量控制,1、表示变量值的离散程度 均数相近,单位相同时,标准差大表示变量

11、值分布较分散,反之亦然。 比较度量衡单位不同或均数相差悬殊的多组资料的变异度时,需改用变异系数coefficient of variation,CV表示标准差与均数之比 P29-30例3-7,8,2、正态分布normal (Gaussian) distribution 直方图histogram:横轴表示变量值的大小,以各长方块面积代表频数,P30图3-3,当观察例数逐渐增多,组距细分时变一条光滑的曲线,形状近似正态曲线 正态曲线:呈对称的钟型,在均数处最高,两侧逐渐低下,两端在无穷远处与底线相靠 正态分布的两个参数:正态总体的均数和标准差(和)。通常用N(,)表示,正态曲线的函数式densit

12、y function: 正态曲线下面积分布规律: :占全部曲线下面积的68.27% 1.64:占全部曲线下面积的90.90% 1.96:占全部曲线下面积的95.00% 2.58:占全部曲线下面积的99.00%,3、正常值(参考值reference value)范围:医学上常把绝大多数(90%,95%,99%)正常人的某指标值范围称为该指标的正常值范围。资料近似正态或经变量变换后符合正态分布时可用上述面积规律来估计95正常值范围,偏态资料可用百分位数法。 正常人并非完全健康的人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。 按实际需要确定上下限或仅上限或仅下限。双侧:1.64,1.96,2.58;单侧:1.28, 1.64, 2.33,4、质量控制:为了控制实验中的检测误差,常以均数加减2个标准差作为上、下警戒值,以均数加减3个标准差作为上、下控制值。 5、标准正态分布 标准化变换: 若x服从正态分布N(,),由则u服从均数为0,标准差为1的正态分布,称为标准正态分布。u(外文资料用z表示)称为标准正态离差the standardized deviate (or z-value) 可以借助标准正态表估计任意(x1,x2)范围内的频数比例(附表31,标准正态分布表),

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1