第二章定量资料的统计描述.ppt

上传人:本田雅阁 文档编号:2614194 上传时间:2019-04-19 格式:PPT 页数:67 大小:2.37MB
返回 下载 相关 举报
第二章定量资料的统计描述.ppt_第1页
第1页 / 共67页
第二章定量资料的统计描述.ppt_第2页
第2页 / 共67页
第二章定量资料的统计描述.ppt_第3页
第3页 / 共67页
亲,该文档总共67页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第二章定量资料的统计描述.ppt》由会员分享,可在线阅读,更多相关《第二章定量资料的统计描述.ppt(67页珍藏版)》请在三一文库上搜索。

1、第二章 定量资料的统计描述,2019年4月19日星期五,徐州医学院卫生事业管理教研室,2,教学要求 了解:通过电脑实验了解定量资料频数分布表的编制方法和分布规律;了解偏度系数和峰度系数的计算和意义。 熟悉:利用统计图表描述定量资料的基本方法;制作统计图表的基本要求和规则;百分位数的计算方法。 掌握:描述定量资料集中趋势指标的计算方法和适用条件;计描述定量资料离散趋势指标的计算方法和适用条件;常用统计图表的制作方法。,第二章 定量资料的统计描述,2019年4月19日星期五,徐州医学院卫生事业管理教研室,3,第二章 定量资料的统计描述,第二节 定量资料的特征数,第三节 常用统计图表,第一节 频数分

2、布,2019年4月19日星期五,徐州医学院卫生事业管理教研室,4,第一节 频数分布,对样本量较大的资料进行统计描述常用方法是频数分布表(frequency distribution table)法,频数表可以显示数据分布的范围与形态。使用统计软件(如SPSS、SAS、PEMS等)可以方便地由原始数据编制出频数分布表。 离散型定量变量的频数分布(略) 连续型定量变量的频数分布,2019年4月19日星期五,徐州医学院卫生事业管理教研室,5,图2-2 某地120名1835岁健康成年男性居民血清铁含量(mol/L),2019年4月19日星期五,徐州医学院卫生事业管理教研室,6,频数表编制步骤,一、计算

3、极差或全距(range) 观察值中最大值和最小值之差,常用R表示 本例 R29.647.4222.22(mol/L) 二、决定组数、组距和组段 一般设1015组,常用全距1/10取整做组距,各组起点为下限(方便数),起始组应包括最小值,最终组应包括最大值。 本例 组距(i)设为2(mol/L) 三、列表划记并清点频数(f) 按照“下限X上限”的原则划记归组,清点频数、计算频率、累计频数、累计频率等。本例见下表,2019年4月19日星期五,徐州医学院卫生事业管理教研室,7,表2-2 某地120名1835岁健康成年男性居民血清铁含量(mol/L),组段 划记 频数 频率 累计频数 累计频率 (1)

4、 (2) (3) (4) (5) (6) 6 1 0.83 1 0.83 8 3 2.50 4 3.33 10 . 6 5.00 10 8.33 12 . 8 6.67 18 15.00 14 . 12 10.00 30 25.00 16 20 16.67 50 41.67 18 27 22.50 77 64.17 20 18 15.00 95 79.17 22 12 10.00 107 89.17 24 8 6.67 115 95.83 26 4 3.33 119 99.17 2830 1 0.83 120 100.00 120 100,2019年4月19日星期五,徐州医学院卫生事业管理教研

5、室,8,在表2-2的基础上,可以绘制直方图如下:,图形中间的直条高,两边对称(或基本对称)地逐渐减少,为正态分布或近似正态分布,若集中位置偏向左侧为正偏态分布(skewed positively distribution)若集中位置偏向右侧为负偏态分布(skewed negatively distribution)。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,9,第二章 定量资料的统计描述,第二节 定量资料的特征数,第三节 常用统计图表,第一节 频数分布,2019年4月19日星期五,徐州医学院卫生事业管理教研室,10,定量资料的特征 集中趋势 (Central Tendency

6、) 变异程度 (Variation) 分布形状(Shape),2019年4月19日星期五,徐州医学院卫生事业管理教研室,11,定量变量的特征,定量变量的,特征,均数,几何均数,中位数,众数,调和均数,集中趋势,全距,四分位间距,方差,标准差,变异系数,离散趋势,偏度系数,分布形状,峰度系数,2019年4月19日星期五,徐州医学院卫生事业管理教研室,12,一、算术均 数(均数) Mean,意义:均数是描述一组数据的集中趋势(Central Tendency)或平均水平的最常用统计指标。用符号 表示样本均数,表示总体均数。,计算: 1、直接法(基于原始数据) 2、加权法(基于频数表),2019年4

7、月19日星期五,徐州医学院卫生事业管理教研室,13,表2-3 加权法计算均数,x0=(组段上限+组段下限)/2,d fd -6 -6 -5 -15 -4 -24 -3 -24 -2 -24 -1 -20 0 0 1 18 2 24 3 24 4 16 5 -26,2019年4月19日星期五,徐州医学院卫生事业管理教研室,14,本例 (mol/L),简捷法 (mol/L),适用条件:适用于对称分布资料,尤其是正态或近似正态分布资料。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,15,意义:常用来反映一组含多个数量级的数据的集中位置,以符号G表示。,二、几何均数 Geometric

8、mean,计算: 1、直接法(基于原始数据) 2、加权法(基于频数表),2019年4月19日星期五,徐州医学院卫生事业管理教研室,16,例5:7名慢性迁延性肝炎患者的HBsAg滴度资料为1:16,1:32,1:32,1:64,1:64,1:128,1:512。试计算平均滴度。,例6 表2-4 52例慢性迁延性肝炎患者的HBsAg滴度资料,2019年4月19日星期五,徐州医学院卫生事业管理教研室,17,适用条件:适用于观察值变化范围跨越多个数量级的数据,尤其是对数正态分布资料。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,18,三、中位数 Median,意义:是反映一组数据集中趋势

9、的位置指标,在全部实测值中有一半数值比它小,有一半数值比它大。常用符号M表示。 百分位数常用符号Px表示,是排序后的全部实测值的某百等份分割值,即在全部实测值有X%个数值比它小,1-X%个数值比它大,中位数就是一个特定的百分位数,即M=P50。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,19,计算:中位数为全部实测值排序后的中间数值或中间两个数值的算术均数。 1、直接法(基于原始数据) 如果 n 是奇数, 即为序列的中间值 如果 n 是偶数, 则为两个中间值的均值,2019年4月19日星期五,徐州医学院卫生事业管理教研室,20,2、内插法(基于频数表),为Px所在组的下限,为该

10、组段的频数,为该组段的组距,为总频数,为该组段之前的累计频数,2019年4月19日星期五,徐州医学院卫生事业管理教研室,21,表2-2 某地120名1835岁健康成年男性居民血清铁含量(mol/L),组段 频数 频率 累计频数 累计频率 (1) (3) (4) (5) (6) 6 1 0.83 1 0.83 8 3 2.50 4 3.33 10 6 5.00 10 8.33 12 8 6.67 18 15.00 14 12 10.00 30 25.00 16 20 16.67 50(fL) 41.67 18(L) 27(fM) 22.50 77 64.17 20 18 15.00 95 79.

11、17 22 12 10.00 107 89.17 24 8 6.67 115 95.83 26 4 3.33 119 99.17 2830 1 0.83 120 100.00 120 100,2019年4月19日星期五,徐州医学院卫生事业管理教研室,22,适用条件:资料不限,但最常用于非对称分布资料。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,23,四、众 数 Mode,意义: 全部观察值中出现次数最多的数值。 (Value That occurs Most Often) 1. 用于度量数据的集中趋势(Central Tendency) 2. 不受极值的影响 3. 可能会出现没

12、有众数或多个众数的情形 4. 对定量数据和定性数据均适用,2019年4月19日星期五,徐州医学院卫生事业管理教研室,24,五、调和均数 Harmonic mean,意义: 全部观察值倒数的算术均数的倒数为调和均数。常用符号H表示。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,25,定量变量的特征,定量变量的,特征,均数,几何均数,中位数,众数,调和均数,集中趋势,全距,四分位间距,方差,标准差,变异系数,离散趋势,偏度系数,分布形状,峰度系数,2019年4月19日星期五,徐州医学院卫生事业管理教研室,26,一、全 距(极差)Range,意义:全距又称极差,常用符号R表示。反映一组

13、数据的变异范围。用极差反映数据的变异程度常常比较粗略和不稳定。 计算:R=最大值-最小值,适用条件:资料不限。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,27,二、四分位间距 quartile range,意义:P75和P25分别称为上、下四分位数。四分位数间距Q是全部观察值中居中的一半数值散布的范围。用其反映数据的离散程度比极差稳定。 计算:Q=P75-P25,适用条件:资料不限。,25%,25%,25%,25%,P25 P50 P75,2019年4月19日星期五,徐州医学院卫生事业管理教研室,28,三、方差 Variance,意义:若要克服极差和四分位数间距不能反映每个观察

14、值之间的离散情况的缺点,就必须全面考虑到每个观察值。,结果虽不为0,但又受观察例数影响。因此可取离均差平方和的均值,简称方差或均方。总体方差用2表示,样本方差用S2表示。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,29,计算: 总体方差 样本方差,自由度(degrees of freedom),从频数表计算样本方差,2019年4月19日星期五,徐州医学院卫生事业管理教研室,30,四、标准差 Standard Deviation,意义:标准差是方差的算术平方根,度量单位与原变量一致。与方差一样只取正值。二者都反映总体中观察值之间的变异程度,数值越小,变异程度越小;反之亦然。,计算

15、: 总体标准差 样本标准差,适用条件:适用于对称分布资料,尤其是正态或近似正态分布资料。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,31,标准差的意义和用途,1、说明资料的离散趋势(或变异程度),标准差越大,说明变异程度越大。经常与均数一起描述资料的特征,标准差愈小,均数的代表性愈好。 2、用于计算变异系数。 3、用于计算标准误。 4、结合均数与正态分布的规律估计参考值的范围。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,32,标准差计算示例一,某大学管理统计学抽考成绩,可用SPSS、SAS、PEMS等软件计算,2019年4月19日星期五,徐州医学院卫生事业管理教

16、研室,33,标准差计算示例二,表2-5 频数表法计算标准差,可用SPSS、SAS、PEMS等软件计算,2019年4月19日星期五,徐州医学院卫生事业管理教研室,34,五、变异系数 Coefficient of Variation,意义:变异系数常用符号CV表示。它是标准差与算术均数之比,主要用于量纲不同的变量间或均数差别较大变量间变异程度的比较。 计算:,适用条件:适用于量纲不同的变量间或均数差别较大变量间变异程度的比较。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,35,定量变量的特征,定量变量的,特征,均数,几何均数,中位数,众数,调和均数,集中趋势,全距,四分位间距,方差,

17、标准差,变异系数,离散趋势,偏度系数,分布形状,峰度系数,2019年4月19日星期五,徐州医学院卫生事业管理教研室,36,变量分布形态,负偏态 正态 正偏态,2019年4月19日星期五,徐州医学院卫生事业管理教研室,37,一、偏度系数 coefficient of skewness,意义: 理论上,总体偏度系数为0时,分布是对称的;取正值时,分布为正偏峰;取负值时,分布为负偏峰。 计算:,2019年4月19日星期五,徐州医学院卫生事业管理教研室,38,二、峰度系数 coefficient of kurtosis,意义: 理论上,正态分布的总体峰度系数为0,取正值时,其分布较正态分布的峰尖峭;取

18、负值时,其分布较正态分布的峰平阔。 计算:,2019年4月19日星期五,徐州医学院卫生事业管理教研室,39,第二章 定量资料的统计描述,第二节 定量资料的特征数,第三节 常用统计图表,第一节 频数分布,2019年4月19日星期五,徐州医学院卫生事业管理教研室,40,一、统计图表的基本概念,统计表(statistical table) 把统计分析资料及其指标用表格列出,称为统计表。它可以代替冗长的文字叙述,便于计算、分析和对比。 统计图(statistical graph) 是用点、线、面等表达统计资料中数量及其变化趋势,使统计资料更形象、更易懂,可直观地反映出事物间的数量关系。 由于统计图对数

19、量的表达比较粗略,不便作深入细致的分析,所以一般在绘制统计图时,都应附有统计表。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,41,二、统计表,统计表主要有表序、标题、标目、表体和线条等组成,其基本格式如下:,表序 标题,2019年4月19日星期五,徐州医学院卫生事业管理教研室,42,(一)制表的基本要求,1.标题 : 简明扼要能概括表中内容,它应包括时间、地点、内容等。标题应写在表顶线的上端中间的位置 。 2.标目:用以说明表内数字含义的部分叫标目。 (1)横标目 横标目位于表左侧,是统计表所要叙述的主语,它说明同一横行数字的意义。 (2)纵标目 纵标目位于标目线的上端,是被说

20、明事物的宾语,一般是绝对数或统计指标。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,43,3.线条 线条应尽量减少,除顶线、标目线、合计线和底线外,其余线条均可省略。特别是表的左上角的斜线和两侧的边线应一律不用 。 4.数字 表内的数字一律用阿位伯数字,同一指标位数要对齐,小数点的位数要一致,一般保留12位小数。无数字的空格用“”表示,暂缺或未记录用“”表示。 5.备注 表内不应有其他文字出现,需要说明的备注用“*”号标出,写在表的底线下面。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,44,(二)统计表的种类,1.简单表 只按一个特征或标志分组的统计表称为简单表。

21、如表2-6。 2.复合表 按两个或两上以上特征或标志结合起来分组的统计表称复合表或组合表。如表2-7 。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,45,表2-6 某地某年流行性脑脊髓炎各病型的病死率,2019年4月19日星期五,徐州医学院卫生事业管理教研室,46,表2-7 某地1995年流行性脑脊髓膜炎不同病型病死率与病情轻重的关系,2019年4月19日星期五,徐州医学院卫生事业管理教研室,47,三、统计图,统计图有多种,医学研究工作中常用的统计图有: 直条图、百分直条图、圆形图、线图、半对数线图、直方图、箱式图和统计地图等。,2019年4月19日星期五,徐州医学院卫生事业管

22、理教研室,48,1.正确选择合适的图型,间断性资料: (1)直条图、箱式图比较各个相互独立的样本指标 。 (2)圆形图、百分直条图表示各组成部分或各构成部分的情况 。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,49,连续性资料 线图表示数量随时间的变迁;表示某种现象随另一种现象而变迁 。 半对数线图比较两个或几个率的变化速度 直方图表示变量的频数分布。 地域性资料 : 统计地图 表示某种事物的地理分布 。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,50,(1)按资料的性质与分析的目的恰当地选用图形。 (2)每图应有标题,其要求与统计表相同,一般放在图下方正中。

23、(3)纵横两轴应有标目并注明单位。 横标目:一般表示主语,如疾病名称、发病时间、年龄组等,尺度自左向右; 纵标目:表示宾语,一般表示频数、比或率,尺度自下而上,一般需从零开始,由小到大。 纵横两轴长宽比例一般为5:7为宜。 (4)若图中用不同颜色或线条代表不同事物,则须在图中加以说明。,2.制图的基本要求,2019年4月19日星期五,徐州医学院卫生事业管理教研室,51,3、常用统计图及其绘制方法,(1)直条图(bar graph) 它是以等宽直条的长短来表示各指标的数值,用来表示各相互独立指标之间的对比关系。直条图有单式直条图(见图2-3)、复式直条图(见图2-4)两种。,2019年4月19日

24、星期五,徐州医学院卫生事业管理教研室,52,图2-3 2004年某省各市流感发病率,图2-4 2004年某省三种主要死因死亡率,2019年4月19日星期五,徐州医学院卫生事业管理教研室,53,(2) 圆形图(pie graph) 圆形图是以圆面积为100%,圆内各扇形面积为各部分所占的百分比,用来表示总体各组成部分的构成比。如图2-5。 圆面积的百分之一相当于3.6,将资料各部分所占的百分数乘以3.6即得各部分应占的度数。 圆内各部分按百分比的大小顺序或按事物自然顺序排列,一般以时钟12点或9点的位置作始点,顺时针方向排列。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,54,图2

25、-5 1996年我国农村居民主要疾病的死因构成比,2019年4月19日星期五,徐州医学院卫生事业管理教研室,55,(3)百分直条图(percent bar graph) 亦称构成直条图,其作用和适用范围与圆形图是相同的。它只是以一直条的面积为100%,直条内各段的面积为相应部分所占的百分比。见图2-6。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,56,图2-6 某地1983年五种主要死因构成,2019年4月19日星期五,徐州医学院卫生事业管理教研室,57,(4)线图(line graph) 它是用线段的上升、下降来说明某事物在时间上的发展变化的趋势,或某现象随另一现象变迁的情况

26、。如图2-7,适用于连续性资料。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,58,图2-7 某市市区人口各年度人口学指标,2019年4月19日星期五,徐州医学院卫生事业管理教研室,59,(5)半对数线图(semilogarithmic line graph) 它是纵轴为对数尺度,横轴为算术尺度的线图。由于同样的增长速度在对数尺度上的距离是相等的,因此便于两事物或两种以上事物在发展速度上的对比。如图2-8。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,60,图2-8 某市市区各年度急性传染病、肺结核死亡率,2019年4月19日星期五,徐州医学院卫生事业管理教研室,6

27、1,(6) 直方图(histogram) 直方图是以各矩形的面积表示各组段的频数,各矩形面积的总和为总频数,适用于表示连续性资料的频数分布。如图2-2,2019年4月19日星期五,徐州医学院卫生事业管理教研室,62,2019年4月19日星期五,徐州医学院卫生事业管理教研室,63,(7)箱式图(box plot) 常用于反映几组数据的变化情况并进行直观比较分析,如图2-9。以“箱子”上端为P75, 下端为P25,中间以横线示P50,最大值、最小值为“箱子”上下两个柄,用于数据直观比较分析。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,64,图2-9 抑肿瘤药不同剂量组与对照组用药后小白鼠肿瘤重量的比较,2019年4月19日星期五,徐州医学院卫生事业管理教研室,65,(9)统计地图(statistical map) 统计地图是用点、线、颜色、形象或其他符号绘制于地图上,以表示某种事物的地理分布情况。,2019年4月19日星期五,徐州医学院卫生事业管理教研室,66,2019年4月19日星期五,徐州医学院卫生事业管理教研室,67,谢谢,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1