计量资料的统计分析.ppt

上传人:大张伟 文档编号:5707027 上传时间:2020-07-23 格式:PPT 页数:34 大小:405KB
返回 下载 相关 举报
计量资料的统计分析.ppt_第1页
第1页 / 共34页
计量资料的统计分析.ppt_第2页
第2页 / 共34页
计量资料的统计分析.ppt_第3页
第3页 / 共34页
计量资料的统计分析.ppt_第4页
第4页 / 共34页
计量资料的统计分析.ppt_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《计量资料的统计分析.ppt》由会员分享,可在线阅读,更多相关《计量资料的统计分析.ppt(34页珍藏版)》请在三一文库上搜索。

1、计量资料的统计分析,计量资料的统计描述 正态分布和参考值范围 抽样误差和假设检验 t 检验和u 检验,第二章 集中趋势的统计描述 (Measures of Central Tendency),要求: 掌握:计量资料的频数分布;算术均数、几何均数、中位数适用的资料类型及计算方法。 熟悉:百分位数。,计量资料的统计描述 方法有两类: 1. 统计图表 主要是频数分布表、频数分布图(直方图) 2. 选用适当的统计指标 集中趋势指标、变异程度指标,计量资料(measurement data):对每个观察对象的观察指标用定量方法测定其数值大小所得的资料,一般有度量衡单位。,第一节 频数分布 (Freque

2、ncy Distribution) 由实验或临床观察等各种方式得到的原始数据,如果是计量资料并且观察的例数较多,为了能够显示数据的分布规律,可以对数据进行分组,然后制作频数表或绘制直方图。,例2.1 某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如表所示: 如何有效地组织、整理和表达数据的信息?,确定组数k,通常选择在815之间,确定组距,常用全距的1/10取整作为组距,等距,确定组段,每个组段的起点称组下限,终点称组上限。 第1组段包括最小值,最后1组包括最大值。 组段写为上限开口型,最末一组段同时写出其下限和上限。,列表划记,将原始数据采用划记法或计算机汇 总,得到各个组段的

3、观察单位数 (频数),列成频数表。,一、频数表 (Frequency Table) 频数表:同时列出观察指标的可能取值区间及其在各区间内出现的频数。,表2-2 某地140名正常男子红细胞数的频数表,各组频数分别除以总频数的比值称为频率。各组频率之和应为100。频率描述了各组频数在全体中所占的比重。,累计频数除以总频数的比值称为累计频率。它描述了累计频数在全体中所占的比重。,累计频数:某一指定组段及前面各组段的频数之和。,图2-1 140名正常男子红细胞计数的直方图,二、直方图(Histogram) 直观、形象地表示频数分布的形态和特征。,三、频数表的用途 1.作为陈述资料的形式,可代替原始资料

4、,便于进一步分析 2.便于观察数据的分布类型 3.便于发现资料中某些远离群体的特大或特小的可疑值 4.当样本含量比较大时,可用各组段的频率作为概率的估计值,对称分布: 集中位置在正中,左右两侧频数分布大体对称 偏态分布: 集中位置偏向一侧,频数分布不对称。又分为正偏态分布和负偏态分布。,图2-1 140名正常男子红细胞计数的直方图,正态分布:中间高、两边低、左右对称,正偏态分布:长尾向右延伸,三、频数表的用途 1.作为陈述资料的形式,可代替原始资料,便于进一步分析 2.便于观察数据的分布类型 3.便于发现资料中某些远离群体的特大或特小的可疑值 4.当样本含量比较大时,可用各组段的频率作为概率的

5、估计值,表2-2 某地140名正常男子红细胞数的频数表,常用的有:1. 算术均数(arithmetic mean),简称均数 (mean)2. 几何均数(geometric mean)3. 中位数 (median),第二节 平均数 (Average) 意义: 1.描述一组观察值集中位置或平均水平的统计指标; 2. 作为一组数据的代表值,用于分析和进行组间的比较。,均数,直接法,加权法,表2-2 某地140名正常男子红细胞数的频数表,669.80/1404.78(1012/L),应用:主要适用于对称分布或偏度不 大的资料,尤其适合正态分布资料。,二、几何均数(Geometric Mean ),例

6、:有5个人的血清抗体效价为1:10,1:100, 1:1000,1:10000,1:100000。求平均血清抗体效价。,5个人的平均血清抗体效价为1:1000,二、几何均数(Geometric Mean ) 例2.2 测得10个人的血清滴度的倒数分别为2,2,4,4,8,8,8,8,32,32,求平均滴度。 例2.3 (频数表资料),几何均数的应用,几何均数常用于等比资料,主要用于血清学和微生物学中 用于对数正态分布资料(原始数据不对称,但各变量值取对数后呈对称分布的资料); 观察值不能有0; 观察值不能同时有正值和负值。,中位数 (median) 将一组观察值从小到大按顺序排列,居中心位置的

7、数值即为中位数。,用M表示。 如,2、3、5、 、9、11、12,7,中位数,直接法,n为偶数,某病患者8人的潜伏期(天)分别为5,6,8,9,11,11,13,16。求中位数。,8人的平均潜伏期为10天,即M10(天),n为奇数,有7个人的血压(收缩压)测定值(mmHg)为:120、123、125、127、128、130、132, 求中位数。 M=127(mmHg),频数表计算法,编制频数表 由小到大计算累计频数、累计频率 找出M或Px所在组 代入公式,中位数,频数表资料 表2-4 某地630名正常女性血清甘油三脂含量(mg/dl),L、iM、fM分别为M所在组段的下限、组距和频数, fL为

8、M所在组段之前各组段的累积频数。,中位数的特点 1. 特定的百分位数(p50),在全部观察值中有一半比它大,有一半比它小。应用最广。 2. 不是由全部观察值计算出来的,因此不受特大值、特小值的影响,适用 于描述偏态资料的集中位置。,中位数的特点 3. 只受居中观察值波动的影响,因而不敏感。 4. 理论上,正态分布资料的均数等于中位数,对数正态分布的几何均数等于中位数。但用中位数代替均数、几何均数会减低灵敏度,进一步统计处理的方 法较少,应尽量使用均数和几何均数。,中位数的适用范围,明显偏态分布的资料 开口资料 (资料的一端或两端无确定数据) 资料分布类型不清,百分位数 (percentile)

9、 把一组数据从小到大排列,分成100等份,各等份含1的观察值,分割界限上的值就是百分位数,用Px表示。它是一种位置指标,即一个百分位数Px将总体或样本的全部变量值分为两部分,理论上有x%的变量值比它小,有(100-x)%的变量值比它大。,百分位数(Percentile),L: 组段的下限; iM: 组距; fx: 频数; fL: Px所在组段之前的累积频数。 例2.5 计算例2.4的百分位数P25 、 P75 、 P90。,频数表资料 表2-4 某地630名正常女性血清甘油三脂含量(mg/dl),百分位数的应用 1.中位数是百分位数的特例。其特点是不易受异常值的影响,适用于描述明显偏态分布、或

10、两端无确定数值数据的平均水平。 2.描述数据序列在某百分位置的水平。多个百分位数结合使用如P25和P75可以描述数据的分散程度,用P2.5和P97.5计算医学95%的参考值范围等。,平均数 意义 应用场合 均数 平均数量水平 应用甚广,最适用于对称 分布,特别是正态分布 几何均数 平均增(减) 等比资料; 倍数 对数正态分布资料 中位数 位次居中的 偏态分布;分布不 观察值水平 明;分布末端无确定值 百分位数描述观察序列在某百分位置的水平, 可用于确定医学参考值范围,适用于任何分布。,常用平均数的意义及应用场合,小 结 1. 运用频数表、直方图和统计指标这些技巧能够有效地组织、整理和表达计量资料的信息。 2.平均数是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。其中均数的应用最为广泛,几何均数则多用于血清学和微生物学中,中位数主要用于偏度较大的数据分布资料。 3.百分位数可用来描述资料的观察值序列在某百分位置的水平,中位数是其中的一个特例。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1