二讲集中趋势和离散趋势计量资料的统计描述.ppt

上传人:本田雅阁 文档编号:3108664 上传时间:2019-07-09 格式:PPT 页数:43 大小:1.21MB
返回 下载 相关 举报
二讲集中趋势和离散趋势计量资料的统计描述.ppt_第1页
第1页 / 共43页
二讲集中趋势和离散趋势计量资料的统计描述.ppt_第2页
第2页 / 共43页
二讲集中趋势和离散趋势计量资料的统计描述.ppt_第3页
第3页 / 共43页
二讲集中趋势和离散趋势计量资料的统计描述.ppt_第4页
第4页 / 共43页
二讲集中趋势和离散趋势计量资料的统计描述.ppt_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《二讲集中趋势和离散趋势计量资料的统计描述.ppt》由会员分享,可在线阅读,更多相关《二讲集中趋势和离散趋势计量资料的统计描述.ppt(43页珍藏版)》请在三一文库上搜索。

1、第二讲 集中趋势和离散趋势 (计量资料的统计描述),王晓莉 ,2,基本内容,3,计量资料的统计描述,描述什么? 描述的对象:计量资料,群体,4,5,群体特征的描述:一般先有一个变量,然后会有一系列的变量值,这些变量值就是一个群体。 针对这样一个群体,你想知道什么?(共性与特性,有群体就有变异) 同样是计量资料,但其特点又各不相同(分布问题:正态与非正态,计算均数时也不同),主要内容,频数表 集中趋势 离散趋势 正态分布 正常值范围估计,7,原始资料(变量与变量值,资料性质),一. 频 数 表,频数:当汇总大量的原始数据时,把数据按类型分组,其中每个组的数据个数,称为该组的频数。 频数表(频数分

2、布):表示各组及它们对应的组频数的表格称为频数表或频数分布。,1998年100名18岁健康女大学生身高的频数分布,10,11,频数分布的特征: 集中趋势与离散趋势,12,二、集中趋势(集中位置的描述),一般用平均值来描述。 平均值是一组(群)数据典型或有代表性的值。这个值趋向于落在根据数据大小排列的数据的中心。,13,1.算术均数 2.几何均数 3.中位数,几种常用的平均值:,14,1.算术均数(均数),意义:一组性质相同的观察值在数量上的平均水平。 表示 (总体) X(样本) 特征: (X- X)=0 估计误差之和为0。 应用:正态分布或近似正态分布 注意:合理分组,才能求均数,否则没有意义

3、。,例题: 100名18岁女大学生身高均数的计算 直接法、间接法、计算机 结果:163.48cm,16,有8份抗体血清的抗体效价分别为1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640, 求平均抗体效价。,17,2.几何均数,意义:N个数值的乘积开N次方即为这N 个数的几何均数。 表示:G = = -1 X n 计算: 应用:原始数据分布不对称,经对数转换后呈对称分布的资料。例如抗体滴度。,18,3.中位数、百份位数,意义:将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。 将N个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即

4、为第X百分位数。中位数是百分位的特殊形式。 表示:M 、PX 计算: 应用:偏态资料,开口资料,19,三、离散趋势(离散程度的描述),描述一组数据参差不齐的程度,20,21,常用指标,全距 四分位数间距 方差 标准差 变异系数,22,1.全距、四分位数间距 R :最大最小值之差。 Q:上四分位数(P75)Qu与下四分位数Ql (P25)之差,中间包含了全部观察值的一半。,23,2.标准差,相关概念(公式表示):离均差、离均差平方和 方差(2 S2 ) 标准差的符号: S 标准差的意义:全面反映了一组观察值的变异程度。(越大说明围绕均数越离散,反之说明较集中在均数周围,均数代表性越好),24,标

5、准差的计算(公式): 例题: 100名18岁女大学生身高标准差的计算 结果:3.79 cm 标准差的应用:描述变异程度、计算标准误、计算变异 系数、描述正态分布、估计正常值范围,25,3.变异系数,意义:标准差与均数之比用百分数表示。 符号: CV 计算: CV=(S/X)100% 无单位 应用:单位不同的多组数据比较 均数相差悬殊的多组资料,26,四、正态分布,什么是分布? 1、图形 2、特征 3、面积,27,1998年100名18岁健康女大学生身高的频数分布,28,1、正态分布的图形,29,正态分布,30,2、正态分布的特征,均数处最高; 均数为中心对称; 2个参数 N( ,):决定图形的

6、形状和位置 曲线下的面积有一定规律。,31,32,正态分布的特殊形式:,标准正态分布N(0 ,1); 标准正态变换(变换公式); 例题:一次统计测验的平均分是72,标准差是15,求60分、93分、72分的标准分数。 上例中,身高为160cm女大学生的标准分是多少?,33,34,3、曲线下面积,横轴上曲线下的面积为1 曲线下,横轴上对称于u的面积相等,从-到; 1个标准差位置的面积,95%面积下的标准差, 99%面积下的标准差 95%,99%的面积公式: z 与所对应的面积P成反比。,特点:,35,定义:又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。 习惯上是确定包括9

7、5%的人的界值。(正态分布的应用),五、(医学)正常值范围,37,单双侧: 根据指标的实际用途,有的指标有上下界值,过高过低均属异常;某些指标过高为异常,只需确定上限;某些指标过低为异常,只需确定下限。 估计的方法: 1、正态分布法 2、百分位数法,1.正态分布法 应用条件:正态分布或近似正态分布资料 计算 (双侧) 95% 正常值(医学参考值)范围公式: (x1.96S,x1.96S ),例如:某校女大学生身高的95%正常值范围 (163.841.963.79,163.841.963.79 ) 即(156.41 cm , 171.27 cm ),39,已知:x = 119.95cm, s =

8、 4.72cm. 试问: (1) 估计该地7岁男童身高在110cm以下者 占该地7岁男童的百分比。 (2) 估计该地7岁男童身高在身高在130cm 以上者占该地7岁男童的百分比。 (3) 估计该地7岁男童身高在107.77cm到 132.13cm之间的占该地7岁男童的百分 比。,例题:某市1982年100名7岁男童的身高,40,2.百分位数法,P19例题 应用条件 : 偏态分布资料 计算公式: 双侧界值:P 2.5 P 97.5 单侧 上界: P 95 单侧 下界: P 5,41,小结 习题: 1.各观察值加同“1”后: A.均数不变,标准差改变 B.均数改变,标准差不变 C.二者均不变 D.均改变 2.用均数和标准差可全面描述: A.正偏态资料 B.负偏态资料 C.正态分布和近似正态分布 D.任何分布 3.正态分布曲线下,从均数u 到u +1.96的面积为; A.95% B.45% C. 97.5% D.47.5%,42,P22 1976年美国8岁男孩的平均身高为146厘米,标准差为8厘米,问95%的人身高在什么范围内。估计在该研究中有%多少的男孩平均身高在138与154之间?又有多少在130到162之间?,43,谢谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1