第五部分离中趋势测量法.ppt

上传人:本田雅阁 文档编号:3124732 上传时间:2019-07-13 格式:PPT 页数:23 大小:450.02KB
返回 下载 相关 举报
第五部分离中趋势测量法.ppt_第1页
第1页 / 共23页
第五部分离中趋势测量法.ppt_第2页
第2页 / 共23页
第五部分离中趋势测量法.ppt_第3页
第3页 / 共23页
第五部分离中趋势测量法.ppt_第4页
第4页 / 共23页
第五部分离中趋势测量法.ppt_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《第五部分离中趋势测量法.ppt》由会员分享,可在线阅读,更多相关《第五部分离中趋势测量法.ppt(23页珍藏版)》请在三一文库上搜索。

1、2019/7/13,1,第五章 离中趋势测量法,主要内容:(1)变异指标; (2)全距和四分位差; (3)平均差、标准差和标准分; (4)绝对离势和相对离势;(5)偏度(及峰度)。,2019/7/13,2,所谓离中趋势,是指数列中各变量值 之间的差距和离散程度。离势小,平均数 的代表性高;离势大,平均数代表性低。,例如有A、B、C、D四组学生各5人的成绩如下: A组:60 ,60,60,60,60 B组:58,59,60,61,62 C组:40,50,60,70,80 D组:80,80,80,80,80 数据显示,平均数相同,离势可能不同;平均数不同,离势可能相同。,2019/7/13,3,变

2、异指标如按数量关系来分有以下两类; 凡用绝对数来表达的变异指标,统称绝对离势; 凡用相对数来表达的变异指标,统称相对离势;,主要有极差、平均差、四分位差、标准差等。,主要有异众比率、标准差系数、平均差系数和一些常用的偏态系数。,变异指标用以反映总体各单位标志值的变动范围或参差程度,与平均指标相对应,从另一个侧面反映了总体的特征。,2019/7/13,4,第一节 全距与四分位差,1.全距(Range) R =Xmax Xmin 例 求74,84,69,91,87,74,69这些数字 的全距。 解 把数字按顺序重新排列:69,69,74, 74,84,87,91,显然有 R =Xmax Xmin

3、916922,全距(R):最大值和最小值之差。也叫极差。全距越大,表示变动越大。,2019/7/13,5,运用上述方法计算左边数列的全距,对分组资料,不能确知最大值和最小值,求全距: (1)用组值最大组的组中值减去最小组的组中值 (2)用组值最大组的上限减去最小组的下限 (3)用组值最大组的组中值减去最小组的下限; 或最大组的上限减去最小组的组中值,2019/7/13,6,优点: 缺点:,计算简单、 直观。,(1)受极端值影响大; (2) 没有量度中间各个单位间的差异性,数据利用率 低,信息丧失严重; (3)受抽样变动影响大,大样本全距比小样本全距大。,2019/7/13,7,2.四分位差(Q

4、uartile deviation) 第三四分位数和第一四分位数的半距。 避免全距受极端值影响大的缺点。,求下列两组成绩的四分位差: A: 78 80 82 85 89 87 90 86 79 88 84 81 B: 55 68 78 88 99 100 98 90 85 83 84 81,请大家计算一下,看能否算对,2019/7/13,8,第二节 平均差(Mean absolute deviation),要测定变量值的离中趋势,尤其是要测定各变量值 相对于平均数的差异情况,一个很自然的想法就是计算 各变量值与算术平均数的离差。平均差是离差绝对值的 算术平均数。 1.对于未分组资料 2.对于分

5、组资料 3.平均差的性质,在受抽样变动、极端值影响,处理不确定组距方面均同于算术平均数;不适于代数运算,其理论意义不易阐述。,2019/7/13,9,例1 试分别以算术平均数为基准,求85,69, 69,74,87,91,74这些数字的平均差。 例2 试以算术平均数为基准,求下表所示数据 的平均差。,计算左边数列的平均差,2019/7/13,10,第三节 标准差(standard deviation),各变量值对其算术平均数的离差平方的算术平均数的平方根,均方差,又称用S表示。 即克服平均差带有绝对值的缺点,又保留其综合平均的优点。,1. 对于未分组资科,2019/7/13,11,求72、81

6、、86、69、57这些数字的标准差。,2019/7/13,12,2. 对于分组资料,计算左边数列的标准差,2019/7/13,13,计算左边数列的标准差,例 调查大一男生60人的身高情况如下表所示,求 他们身高的标准差。,2019/7/13,14,解 因为是分组资料,计算标准差运用加权式,并 参见下表,2019/7/13,15,标准差是反映总体各单位标志值的离散状况和差异 程度的最佳测度。 (1)以算术平均数为基准计算的标准差比以其他任 何数值为基准计算的标准差要小。“最小二乘方”性质 各变量值对算术平均数的离差的平方和,必定小于他们 对任何其他数偏差的平方和。 (2)它将总体中各单位标志值的

7、差异全包括在内,受 抽样变动影响小。但在受极端值影响以及处理不确定组 距方面,缺点同算术平均数。 值得注意的是,在推论统计中我们将发现,方差是 比标准差更有理论价值的概念。所谓方差,即标准差的 平方,它直接写成 。 也常被称为变异数。,3. 标准差的性质,2019/7/13,16,4.标准分(standard score),以离差和标准差的比值来测定变量 与 的相 对位置。使原来不能直接比较的离差标准化,可以相 互比较,加、减、平均。,(1)Z是和X一一对应的变量值; (2)Z分数没有单位,是一个不受原资料单位影响的相对数,所以可以用于不同单位资料的比较; (3)Z分数实际表达了变量值距总体均

8、值有几个标准差。,2019/7/13,17,Z分数也有标准正态变量之称。按Z值大小编制 出的正态分布表,其用途十分广泛。 Z分数的性质:,Z分数之和等于0,Z分数的算术平均数等于0,Z分数的标准差等于1,方差也等于1,2019/7/13,18,第四节 相对离势,上述各种反映离中趋势的变异指标,都具有和原 资料相同的计算单位,称绝对离势。但欲比较具有不 同单位的资料的参差程度,或比较单位虽相同而均值 不相同的资料的参差程度,离势的绝对指标则很可能 导致某些错误结论。所以,我们还得了解和学习相对 离势。,1. 变异系数 绝对离势统计量与其算术平均数的比率,用V 表示。变异系数是最具有代表性的相对离

9、势。,2019/7/13,19,全距系数 全距系数是众数据的全 距与其算术平均数之比,其计 算公式是 平均差系数 平均差系数是众数据的平 均差与其算术平均数之比,其 计算公式是 标准差系数 标准差系数是众数据的标 准差与其算术平均数之比,其 计算公式是,2019/7/13,20,2. 异众比率 所谓异众比率,是指非众数的频数与总体单位数 的比值,用V R来表示 其中: 为众数的频数; 是总体单位数,异众比率能表明众数所不能代表的那一部分变量值在总体中的比重。,2019/7/13,21,例1:某项调查发现,现今三口之家的家庭最多 (32%),求异众比率。某开发商根据这一报导,将房 屋的户型大部分

10、都设计为适合三口之家居住的样式和面 积,你认为如何呢? 例2:设为测体重,得到成人组和婴儿组各100人的 两个抽样总体。成人组平均体重为65千克,全距为10千 克;婴儿组平均体重为4千克,全距为2.5千克。能否认 为成人组体重的离势比婴儿组体重的离势大? 例3:对一个群体测量身高和体重,平均身高为 170.2厘米,身高标准差为5.30厘米;平均体重为70千克, 体重标准差为4.77千克。比较身高和体重的离散程度。,2019/7/13,22,3. 偏态系数,我们在前面讨论统计图时已经对频数分布的正态和 偏态有所认识。我们又看到了算术平均数与中位数、众 数之间存在的关系:当总体呈对称分布时, 、 、 三者完全相等;当总体呈不对称的偏态分布时,它们之 间存在着数量(位置)的差异。因此,偏态可由 与 的差来表示,即 为了使不同数列的偏态值可比,同样可计算偏态的相 对数,即偏态系数,用来表示,2019/7/13,23,偏斜系数是以标准差为单位的算术平均数与众 数的离差,其取值一般在0与土3间。偏斜系数为0表 示对称分布,偏斜系数为或则表示极右或极左偏态。,讨论左边数列关于年龄的偏态和偏态系数,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1