第三章统计描述.ppt

上传人:本田雅阁 文档编号:3142086 上传时间:2019-07-16 格式:PPT 页数:54 大小:270.02KB
返回 下载 相关 举报
第三章统计描述.ppt_第1页
第1页 / 共54页
第三章统计描述.ppt_第2页
第2页 / 共54页
第三章统计描述.ppt_第3页
第3页 / 共54页
第三章统计描述.ppt_第4页
第4页 / 共54页
第三章统计描述.ppt_第5页
第5页 / 共54页
点击查看更多>>
资源描述

《第三章统计描述.ppt》由会员分享,可在线阅读,更多相关《第三章统计描述.ppt(54页珍藏版)》请在三一文库上搜索。

1、3-1,第三章 统 计 描 述,第一节 统计图与统计表 第二节 分布的集中趋势 第三节 分布的离中趋势 第四节 分布的偏度和峰度,3-2,第一节 统计表与统计图,一、统计表 (一)统计表的定义和结构 1、统计表:把统计数据按一定的顺序排列在表格上,就形成了统计表。它清楚地、有条理地显示统计资料,直观地反映统计分布特征,是统计分析的一种重要工具。,3-3,2、统计表的结构,1)从表式上看,表格包括总标题、横行标题、纵栏标题和指标数值四个部分。 2)从内容上看,统计表由主词栏和宾词栏两个部分组成。 主词栏是统计表所要说明的总体及其组成部分;宾词栏是统计表用来说明总体数量特征的各个统计指标。此外,统

2、计表还有补充资料、注解、资料来源、填表单位、填表人等。,3-4,(二)统计表的分类,1、按主词的结构分类 1)简单表:主词未经任何分组的统计表称为简单表,也称一览表。主词罗列各单位的名称。 2)分组表:主词只按一个标志进行分组形成的统计表,也称简单分组表,。 3)复合表:主词按两个或两个以上标志进行分组的统计表,也称复合分组表。,3-5,2、按宾词设计分类,1)宾词简单排列是指宾词不加任何分组、按一定顺序排列在统计表上,就是宾词简单排列表。 2)宾词分组平行排列是指宾词栏中各分组标志彼此分开,平行排列,就是宾词分组平行排列表。,3-6,(三)统计表的设计,统计表的设计应注意如下事项: 1.线条

3、的绘制。表的上下端应以粗线绘制,表内纵横线以细线绘制。表格的左右两端一般不划线,采用“开口式”。 2.合计栏的设置。 3.标题设计。以简练而又准确的文字表述统计资料的内容、资料所属的空间和时间范围。,3-7,4.指标数值的填写。当数字因小可略而不计时,可写上“0”;当缺某项数字资料时,可用符号“”表示;不应有数字时用符号“”表示。 5.计量单位。统计表必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在表头的右上方。如果表中各格的指标数值计量单位不同,可在横行标题后添一列计量单位。 6.注解或资料来源。在统计表下,应注明资料来源。,3-8,二、统计图,1、直方图:用直方形的宽度和

4、高度来表示次数分布的图形。绘制直方图时,横轴表示各组组限,纵轴表示次数(一般标在左方)和比率(或频率,一般标在右方)。 2、折线图:折线图可以在直方图的基础上,用折线将各组次数高度的坐标连接而成,也可以用组中值与次数求坐标点连接而成 3、曲线图:用平滑曲线连接各组次数坐标点即得分布曲线。,3-9,第二节 统计平均数 众数 中位数,一、主要的统计平均数 (一)统计平均数的含义 (二)统计平均数的作用 (三)统计平均数的分类,3-10,二、算术平均数,1.算术平均数的基本公式 计算平均数的要求:总体标志总量必须是总体各单位标志值的总和,标志值和单位之间一一对应。,3-11,2.计算方法,(1)简单

5、算术平均数。简单算术平均数主要用于未分组资料,用总体各单位标志值简单加总得到的标志总量除以单位总量而得。计算公式:,3-12,(2)加权算术平均数。,A. 加权算术平均数主要用于原始资料已经分组,并得出次数分布的条件。计算公式: fi 为各组标志值出现的次数。,3-13,B.权数的意义和作用,权数:各组次数(频数)的大小所对应的标志值对平均数的影响具有权衡轻重的作用。 当各组的次数都相同时,即当f1=f2=f3=fn时: 加权算术平均数就等于简单算术平均数。,3-14,3.是非标志的平均数,在总体中,具有某种性质的单位占总体的比率为p,不具有该种性质的单位占总体的比率为 q,以1作为具有某种性

6、质的单位的标志值,以0作为不具有该种性质的单位的标志值: p也称为总体中具有某种属性的单位成数,是非标志的平均数。,3-15,4.算术平均数的数学性质,(1)算术平均数与标志值个数的乘积等于各标志值的总和。 简单算术平均数: 加权算术平均数:,3-16,(2)各个标志值与其算术平均数的离差之和等于零。 简单算术平均数: 加权算术平均数:,3-17,(3)各标志值与算术平均数离差的平方和为最小值。 (4)对被平均的变量实施某种线性变换后,新变量的算术平均数等于对原变量的算术平均数实施同样的线性变换的结果。 (5)对于任意两个变量x和y,它们的代数和的算术平均数等于两个变量的算术平均数的代数和。,

7、3-18,三 调和平均数,1.简单调和平均数:标志值的倒数的算术平均数的倒数。,3-19,2.加权调和平均数,计算公式: 在权数选择合适时,加权调和平均数实际上是加权算术平均数的变形:,3-20,当各组标志总量相等,m1=m2=mn时,加权调和平均数可化简成为简单调和平均数形式。,3-21,四、几何平均数,1.几何平均数:是n项标志值连乘积的n次方根。 2.分类: (1)简单几何平均数:是n个标志值xi连乘积的n次方根。计算公式为: G= 式中G表示几何平均数,xi表示各项标志值。,3-22,(2)加权几何平均数,加权几何平均数是各标志值fi次方的连乘积的次方根,计算公式为: G=,3-23,

8、四、幂平均数,设有一组变量求各变量k次方的和: 根据算术平均数的数学性质1,以幂平均代替各具体变量xi,其数值总和不变,则 称为k阶幂平均数,当k 取不同的整数值时,幂平均数就给出不同的数值平均数计算公式。,3-24,当k=1时,幂平均数, 为算术平均数计算公式。 当k=-1时,幂平均数 ,为调和平均数计算公式。 当 时, 为几何平均数计算公式。,3-25,幂平均数的是关于k阶的递增函数,即幂平均数是随着k的增大而增大,随着k的减少而减少,当k1k2时,就有: 因为算术平均数、几何平均数、调和平均数都是幂平均数的k阶数由1递减为0又减为-1的特例,三者之间的一般数量关系为:调和平均数小于几何平

9、均数小于算术平均数;当各变量相等时,调和平均数等于几何平均数等于算术平均数。,3-26,五、 众数 Mo,1.定义:众数是指社会现象总体中最普遍出现的标志值。 2.众数的确定 1)单项式分配数列确定众数:出现次数最多的标志值就是众数。 2)组距式分配数列确定众数:由组距数列确定众数,先确定众数组,再通过一定的公式计算众数的近似值。,3-27,3. 众数的几何意义,3-28,4. 组距式数列确定众数的公式,下限公式: 上限公式:,3-29,六、中位数,1.定义: 中位数是将总体各个单位按其标志值的大小顺序排列,处于数列中点的那个单位的标志值,在总体中,标志值小于中位数的单位占一半;标志值大于中位

10、数的单位也占一半。,3-30,2.中位数的确定,1)未分组资料确定中位数。 将总体各单位的标志值按照大小顺序排列, 当总体单位数n为奇数时: 当总体单位数n为偶数时,:,3-31,2)单项式分组资料确定中位数,当 为奇数时: , 当 为偶数时,3-32,3) 组距式分组资料确定中位数,下限公式: 上限公式:,3-33,3. 众数、中位数和算术平均数的 关系,区别: 1) 三者的含义不相同; 2) 三者的计算(确定)方法不同; 3) 对资料的要求不同, 4) 对数据的“灵敏度”、“抗耐性”和“概括能力”不同。,3-34,联系: (1) 三者都是作为反映总体一般水平(或集中趋势)的平均指标: (2

11、) 三者之间存在着一定的数量关系, A.在对称的正态分布条件下:算术平均数等于众数等于中位数: B.在非对称正态分布的情况下,众数、中位数和平均数三者的差别取决于偏斜的程度,偏斜的程度越大,它们之间的差别越大。,3-35,当次数分配呈右偏(正偏)时:算术平均数受极大值的影响 当次数分配呈左偏(负偏)时,算术平均数受极小值的影响 中位数则总是介于众数和平均数之间。,3-36,3、皮尔生经验法则,分布在轻微偏斜的情况下,众数、中位数和算术平均数数量关系的经验公式为:,3-37,第三节 分布的离中趋势,一、变异指标的含义与作用 1.定义:变异指标反映总体内部的离中趋势或变异状况。变异指标值越大,表明

12、总体各单位标志的变异程度越大。 2.作用: (1)衡量平均指标的代表性。 (2)反映现象变动的均衡性。 (3)研究总体标志值分布偏离正态的情况。 (4 )进行抽样推断等统计分析的一个基本指标。,3-38,二、极差与四分位差,1、极差: 1)极差也称全距,它是统计总体中两个极端标志值之差,表明总体中标志值变动的范围。 2)计算公式: (未分组) (分 组) 式中:Umax代表最高组的上限; Lmin代表最低组的下限。 3)特点:计算简便,直观易于理解。,3-39,2、四分位差 1)计算公式:数列的3/4位次与1/4位次的标志值之差除以2。 2)特点:四分位差避免了数列中极端值的影响,但去头弃尾,

13、丢失大量的原始数据。,3-40,三、平均差(A.D),1、定义:平均绝对偏差,总体所有单位的标志值与其平均数的离差绝对值的算术平均数。 2、计算公式: 3、特点:概括地反映了所有单位标志值的变异程度,但因取绝对值,数学性质不理想,实际中较少用。,3-41,四、方差与标准差,(一)数量标志的方差与标准差 1、数量标志方差与标准差的计算。其计算公式为: 未分组的资料:方差: 标准差 :,3-42,用分组资料计算,方差: 标准差,3-43,2、总方差、组间方差和组内方差。,在资料分组的条件下,总体各标志值对平均数的方差可以分解为组内方差和组间方差。其关系式: 式中: 代表总体方差; 代表组内方差的平

14、均数; 代表组间方差。,3-44,3、方差与标准差的数学性质:,1)变量的方差等于变量平方的平均数减去变量平均数的平方。即:,3-45,2)变量对其算术平均数的方差小于对任意常数的方差。 因为 ,所以,当 (x0为任意常数)时, 3) n 个同性质独立变量和的方差等于各个变量方差的和。 设: 则:,3-46,4)n个同性质独立变量平均数的方差等于各变量方差平均数的1/n。 设: 则: 5)变量线性变换的方差等于变量的方差乘以变量系数的平方。 设: 则:,3-47,(二)是非标志的方差与标准差,3-48,四、变异系数,1、变异系数:变异系数也称离散系数,是各变异指标与其算术平均数的比值。 极差系

15、数:极差与其平均数的比值。 标准差系数:标准差与其平均数的比值。 2、作用:消除现象由于不同计量单位、不同平均水平所产生的影响。,3-49,第三节 分布的偏度和峰度,一、统计动差 1、统计动差:也称为距,反映分布偏斜或离散程度的指标。 2、原点动差:变量x关于原点的k阶距,一般形式: (未分组) ( 分组) k= 1时,即1阶的原点动差就是算术平均数。 k= 2时,即2阶的原点动差就是平方平均数。,3-50,3、中心动差:,变量x关于分布中心(平均数)的k阶距。一般形式: (未分组) (分组) 当k=0时,即零阶中心动差 =1; 当k=1时,即一阶中心动差 =0; 当k=2时,即二阶中心动差 = 。,3-51,二、偏度,1、偏度:衡量频数分配不对称程度,或偏斜程度的指标。 2、计算公式:(用距法测定),3-52,当 =0时,左右完全对称,为正态分布;当 0时为正偏斜;当 0时为负偏斜。,3-53,三、峰度,1、峰度:用以衡量频数分配的集中程度,即分布曲线的尖峭程度的指标。 2、计算公式:(用距法测定),3-54,峰度指标=0,分布为正态峰度,当峰度指标0时,表示频数分布比正态分布更集中,分布呈尖峰状态,0时表示频数分布比正态分布更分散,分布呈平坦峰。如图所示:,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1