第三章数据分布特征描述.doc

上传人:scccc 文档编号:14607611 上传时间:2022-02-10 格式:DOC 页数:6 大小:76.50KB
返回 下载 相关 举报
第三章数据分布特征描述.doc_第1页
第1页 / 共6页
第三章数据分布特征描述.doc_第2页
第2页 / 共6页
第三章数据分布特征描述.doc_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第三章数据分布特征描述.doc》由会员分享,可在线阅读,更多相关《第三章数据分布特征描述.doc(6页珍藏版)》请在三一文库上搜索。

1、第三章 数据分布特征描述I.学习目的通过本章的学习, 1。理解统计数据分布的集中趋势和离散程度的概念;2. 掌握描述统计数据分布的集中趋势和离散程度的各代表值的测定、计算与 分析方法 ;3 。能够应用各种指标分析实际问题; 4。了解分布偏度与峰度的描 述。H.课程内容要点第一节 统计变量集中趋势的测定一、测定集中趋势的意义统计数据的 集中趋势 (或中心位置)是指数据向其中心值靠拢或集中的 程度。测定集中趋势是为了表示社会经济现象总体各单位某一标志在一定时 间、地点条件下所达到的一般水平。测定集中趋势的作用有四 : 首先,反映总体各单位变量分布的集中趋势 和一般水平;其次,比较同类现象在不同单位

2、的发展水平;再次,比较同类 现象在不同时期的发展变化趋势或规律 ; 最后, 分析现象之间的依存关系。二、位置代表值测定集中趋势常用的位置代表值有众数和中位数。众数 是总体中最普遍出现的标志值。中位数 是总体各单位按大小顺序序列化后,处在数列中点位置上那个单 位的标志值 .对分组或未分组的资料和组距式变量数列 , 众数和中位数各有不同的确 定方法 .三、数值平均数数值平均数就是均值,它是对总体中的所有数据计算平均值,用以反映 所有数据的一般水平。1、算术平均数 的基本公式是总体标志总量除以总体单位总量。其有简 单式和加权式两种。加权算术平均数中权数的权衡轻重的作用体现在各标志 值对平均数的影响上

3、,权数大的标志值对平均数的影响也大,权数小的标志值对平均数的影响也小。权数必须是标志值的直接承担者,权数与标志值的乘积要具有标志总量的意义 只有当三个量之间存在着客观的数量对等关系 时,各组单位数才是加权算术平均数的合适权数。当各组频数都相等时, 权数不起作用。是非标志的算术平均数算术平均数有四个数学性质。2、 调和平均数是总体中各单位标志值倒数的算术平均数的倒数,又称倒 数平均数”。也有简单调和平均数和加权调和平均数两种。在统计实践中,调和平均数常常被作为算术平均数的变形来使用:当因 为数据的原因不能采用算术平均数的方法计算均值时,可以考虑采用调和平 均数的形式3、 几何平均数是N个变量值(

4、比率)连乘积的N次方根,通常用于时间 上有联系或有先后顺序关系的比率求平均,凡是度量值的连乘积等于总比率或总速度的现象都必须使用几何平均法计算均值。几何平均数根据所掌握数据资料不同,有简单几何平均数和加权几何平 均数两种方法4、幕平均数 是标志值K次方的平均数的 K次方根。5、 计算和应用集中趋势测定指标应注意三个问题:(1 )集中趋势的测 定指标只能应用于同质总体。(2)用组平均数和分配数列补充说明总平均数。 (3)集中趋势指标与离散程度指标相结合。四、集中趋势测定指标的关系1、众数、中位数和算术平均数各自的含义、计算方法不同,但三者之间存在一定的数量联系对称分布时,三者相等;适度正偏斜时,

5、 MO MeX ; 适度负偏斜时则相反。适度偏斜情形下,可采用皮尔生经验公式进行推算:Me M。 2 X Me。2、在相同的数据中,算术平均数、调和平均数和几何平均数在数值是的 关系如下:H G X。第二节 统计变量离散程度的测定一、离散程度测定的意义在实践中,测定离散程度的主要作用在于:1、反映现象总体各单位的标志值的差异程度。2、衡量均值的代表性。3、测定现象变动的均匀性或稳定性程度。一、极差、四分位差和平均差1、极差又称全距,是最大和最小观测值之间的距离。2、 四分位差是在数列中剔除最大和最小各四分之一的数据,是第一和第 三个四分位数之间距离的二分之一。3、平均差是分配数列中各单位标志值

6、与其算术平均数之间离差绝对值的平均数三、方差与标准差方差是总体各单位标志值与其算术平均数离差的平方的算术平均数标准差是方差的平方根,总方差等于组间方差和组内方差平均数之和方差和标准差有5个数学性质。是非标志的方差即0-1分布的方差,当p q 0.5时, 非标志的方差达到最大可能值。方差和标准差有五个数学性质。极差、分位差和标准差都是绝对量指标,它们的计量单位与标志值相同。它们的大小不仅取决于总体的变异情况,也和标志值水平的高低、计量水平 的不同有关。四、离散系数与异众比率离散系数是数量数据的各离散程度指标与其算术平均数的比值。最常用的离散系数是标准差系数:V 。离散系数是一个无量纲的量。它适于

7、比X较不同现象或具有不同水平数据的变异程度的情况。异众比率是指非众数的次数与全部变量值总次数的比率第三节变量分布偏度与峰度的描述一、矩矩也称为动差。它是总体中所有变量值与任意常数离差K次方的算术平均数。矩有原点矩和中心矩两种。一阶原点矩就是变量的算术平均数,二阶 原点矩就是变量平方的算术平均数 一阶中心矩为0,二阶中心矩就是方差。二、偏度偏度指分布不对称的方向和程度,它可用三阶中心动差除以标准差三次 方来度量三、峰度峰度又称峭度,是指分布图形的尖峭程度或峰凸程度。峰度指标可用四 阶中心动差除以标准差四次方再减去3,来度量.皿.考核知识点与考核要求(一)识记:1 算术平均数、调和平均数、几何平均

8、数、幕平均数、众数、中位数指 标的定义、特点与计算方法.2 权数的定义、形式和作用。3. 极差、四分位差、方差和标准差的定义、特点与计算方法。4变异系数尤其是标准差系数的定义、特点与计算方法。5、偏度和峰度的定义、特点与计算方法。(二)领会1 权数的意义及其选择;2 算术平均数的数学性质;3众数、中位数和算术平均数三者之间存在的数量联系;算术平均数、调和平均数和几何平均数之间存在的数量关系(三)应用1 对客观数据进行统计综合描述, 利用集中趋势和离中趋势说明数据的 特征。2。利用偏度和峰度分析数据的分布形状.一、选择题1 C 2 。 D 3.B 4IV.习题详解C 5 。 B 6.ABCDE

9、7 。 ADE 8.BC 9.BCE 10。 ADE、计算题1. 解:(1) X7.4 (元 / 斤)(2 ) Mh6.4 (元/斤)2. 解:(1) X107% ;MO106.7%; Me 107.1%;(4) AD9.4% ;(5)11.7% ;(6) V 10.9%;(7)异众比率=0。65;(8)二3 解:平均商品销售价值 X16.8 (元/公斤)4 解:计算表如下月工资组中值X各组工人比重ff-(%X? ff4502090.055025137.565030195。075015112.58501085。0合计100620.0X X?620元f该工业集团公司工人平均工资620元。5 解:成交额单位:万元,成交量单位:万斤。品种价格(元)X甲市场乙市场成交额成交量成交量成交额MM /XfXf甲1。21.2122。4乙1。42.8211。4丙1.51。5111.5合计-5。5445.3甲市场平均价格X m一 55 1 375 (元/斤)m/X 4乙市场平均价格X 531 325 (元/斤)f 4说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量 不同。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1