第3章数据整理和频数分布.ppt

上传人:本田雅阁 文档编号:2986932 上传时间:2019-06-20 格式:PPT 页数:80 大小:671.02KB
返回 下载 相关 举报
第3章数据整理和频数分布.ppt_第1页
第1页 / 共80页
第3章数据整理和频数分布.ppt_第2页
第2页 / 共80页
第3章数据整理和频数分布.ppt_第3页
第3页 / 共80页
第3章数据整理和频数分布.ppt_第4页
第4页 / 共80页
第3章数据整理和频数分布.ppt_第5页
第5页 / 共80页
点击查看更多>>
资源描述

《第3章数据整理和频数分布.ppt》由会员分享,可在线阅读,更多相关《第3章数据整理和频数分布.ppt(80页珍藏版)》请在三一文库上搜索。

1、统计学教程 第3章 数据整理和频数分布,2019年6月20日/上午8时21分,统计学教程第3章 数据整理和频数分布,3.1 数据的审核和筛选 3.4 绝对数 3.1.1 数据的审核 3.4.1 绝对数的概念 3.1.2 数据的筛选 3.4.2 绝对数的种类 3.1.3 数据的排序 3.4.3 绝对数的计量单位 3.2 数据的分组 3.5 数据的展示 3.2.1 数据分组的意义 3.5.1 统计表 3.2.2 非数值型数据的分组 3.5.2 统计图 3.2.3 数值型数据的分组 3.2.4 组中值 3.3 数据的频数分布 3.3.1 频数与频数分布 3.3.2 累积频数 3.3.3 异距分组与标

2、准组距频数,第3章 数据整理和频数分布,3.1 数据的审核和筛选,统计学教程,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.1.1 数据的审核 1原始数据 原始数据(Raw Data)是指数据搜集所取得到的,未经过数据分组和汇总的,反映个体特征的零散数据。 数据审核(Data Auditing)是指在进行数据整理之前对原始数据的审查和核对。 原始数据包含了所有由调查登记获取的个体信息的初级数据,经过数据整理的数据反映的是总体的综合数量特征和分布状态,原始数据所反映的个体数值特征消失或湮没在总体的综合数量特征和分布状态数值之中了。 数据整理是按照数据分析的要求

3、进行的,数据分析思路和目的决定着数据整理分类或分组。,3.1 数据的审核和筛选,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.1 数据的审核和筛选,2数据审核的内容 统计数据的时效性,准确性、一致性三个方面的标准就是数据审核的基本内容。 (1)统计数据的时效性审核。检查是否在规定的统计调查时间内完成数据搜集,采集的数据是否为规定的调查时点上,或规定的调查时段内的数量特征。 (2)统计数据的准确性审核。从数据的完整性、真实性和精确性角度进行审核。 (3)统计数据的一致性审核。检查统计数据在时间和空间上的连续性和可比性。,2019年6月20日/上午8时21分,统

4、计学教程 第3章 数据整理和频数分布,3.1 数据的审核和筛选,3数据审核的方式 数据审核一般有逻辑检查和技术检查两种方式。 (1)逻辑审核(Logistic Auditing)是按照数据审核的内容,采用逻辑分析的方法,检查原始数据中各项数据是否合理的数据审核方式。逻辑检查要求检查人员具备较强逻辑推理能力,以及丰富的专业知识和数据审核经验。 (2)技术审核(Technical Auditing)是按照数据审核的内容,通过对调查数据原始登记表,和其它原始登记材料进行机械性核对,来实施的数据审核方式。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.1.2 数据的

5、筛选 数据筛选(Data Filter)是指对已有数据的有意识的过滤和挑选,滤去不需要的数据,选出所需要的数据。 从广义上讲,数据审核也是一种数据筛选。这里所讲的数据筛选是指按照数据分析的要求所确定的挑选数据标准,通过对现有数据的逐一比较,从中挑选出一组数据,构成一个数据集合的过程。,3.1 数据的审核和筛选,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.1 数据的审核和筛选,3.1.3 数据的排序 数据排序是指将一组数据按照大小、高低、优劣等顺序进行依次排列的过程。依据数据在经过排序之后的有序序列中的位置确定的测度称为顺序统计量(Order Statist

6、ics)。 数据排序为计算取值范围、最大值、最小值等总体参数提供了便利,有助于人们了解数据大致的分布状态,数据排序也是有效地进行数据分类或分组的前期准备。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.1 数据的审核和筛选,既定的,以前认识活动的成果。,政府统计工作整理环节过程示意图,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.1 数据的审核和筛选,政府统计工作整理环节过程示意图,一般的统计认识过程,第3章 数据整理和频数分布,3.2 数据的分组,统计学教程,2019年6月20日/上午8时21分,统计学教程 第3章 数据

7、整理和频数分布,3.2 数据的分组,3.2.1 数据分组的意义 数据分组(Data Grouping)就是根据研究现象的特点和数据分析的目的,将原始数据按照总体单位的某一特征分为不同的组别。经过数据分组之后形成的分布在各个组里的数据称为分组数据(Grouped Data)。作为数据分组标准的这一特征称为分组标志。 数据分组既可以视为是按照分组标志将原始数据分别归入各个不同的组里,又可以看成是按照分组标志部分具有相同特征原始数据合并在同一组中。在数据分组过程中,强调和突出了原始数据中作为分组标志这一特征,同时忽略和隐去了原始数据中的其它特征。 按照统计研究的要求,科学地选择分组标志是有效进行统计

8、认识活动的基本前提。 数据分组包括非数值型数据分组和数值型数据分组。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.2 数据的分组,3.2.2 非数值型数据的分组 非数值型数据的分组也称为分类。定类数据和定序数据都是对事物质的属性的描述,两者都是一种分类性质的数据,只在分类划分的无序和有序上存在差别。 反映事物自然属性的非数值型数据的分组一般比较简单,只要进行适当的细分或合并,以及选择恰当的分组标志即可。 反映事物社会经济属性的非数值型数据的分组一般比较复杂,往往是人们对事物数量特征进行深入地统计分析之后形成的一种质的划分,这种质的划分体现了人们认识活动对与

9、事物由量变到质变的把握,一般采用国家标准、行业标准或者企业标准等标准化的形式确定下来,并借助统计报表和统计调查方案等方式加以明确,以此来规范和指导后续的统计活动。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.2 数据的分组,在我国现行统计制度中,将城镇家庭分成收入水平由低到高的七组,即最低收入户、低收入户、中等偏下收入户、中等收入户、中等偏上收入户、高收入户、最高收入户,属于定序数据的分组。这七组的划分是将所有调查户依户人均可支配收入由低到高排序,然后按照10%,10%,20%,20%,20%,10%,10%的频数比例依次分组,最后构成了我国城镇家庭分成收

10、入水平由低到高不同收入阶层的定性分组。 表3.1 2003年我国城镇居民家庭基本情况 元 资料来源:2004中国统计年鉴. 北京. 中国统计出版社 2004,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.2 数据的分组,19902002年 江苏省城镇家庭 “可支配收入” 分组表(单位:元),2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.2 数据的分组,19902002年 江苏省城镇家庭可支配收入水平折线图,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.2 数据的分组,3.2.3 数值型数

11、据的分组 1组距分组 (1)组距分组是数值型数据分组的基本形式。数值型数据分组可以分为单变量分组和组距分组。 单变量分组是指每个分组只用一个变量值表示的分组形式,又称为单项分组。单变量分组一般在分组标志为离散变量,且变量的取值范围不是太大的情况下使用。 组距分组是指每个分组用一个数据取值区间表示的分组形式。组距分组适用于按连续变量分组或变量的取值范围较大的离散变量的场合。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.2 数据的分组,(2)组限。在组距分组中,各组之间的取值界限称为组限,一般用表示。其中大者为该组数值变量可能取的最大数值,称之为上限(Uppe

12、r Limit ,U )。小者为该组数值变量可能取的最小数值,称之为下限(Low Limit ,L )。 在一个组距分组中,既有上限又有下限的组称为闭口组,否则称为开口组。 (3)组距。组距分组中,同一分组的上限与下限之间的绝对距离称为组距(Class Width,d)。一般有,组距d上限U 下限L 。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.2 数据的分组,2等距分组 组距分组有等距分组和异距分组之分。等距分组是各组组距全都相等的组距分组,等距分组中各组单位数的多少不会受到组距大小的影响,便于直接比较各组次数的多少,研究次数分布的特征。因此,等距分组

13、是组距分组的基本方法。 等距分组的具体步骤如下。 (1)计算取值范围。 (2)确定组数。 (3)计算组距。 (4)确定组限。 (5)将原始数据按照各自数值大小分配到各组中。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.2 数据的分组,(1)计算取值范围。 取值范围(Value Area)为全体数据中最大数值与最小数值之差,反映了该组数值变量取值的变动幅度,一般用R 表示,有 (3.1) (2)确定组数。 在进行数值型数据分组时,有一个计算组数的经验公式,即斯特格斯(Sturges)公式 (3.2) 确定组数的目的是为了使数据恰当地分布在各组中,数据过于集中

14、和过于分散都有碍于对数据分布特征的展示,不利于后续的分析研究,组距的确定还要根据实际情况,因地制宜地加以确定。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.2 数据的分组,(3)计算组距。 由于取值范围是客观存在的,当组数确定之后,组距也就随之确定了,两者之间成反比例关系。设 H 为组数,即有组距d=R/H 。为了便于数据分组和组限的划定,组距一般取5,10的整数倍。 (4)确定组限。 确定组限就是具体规定各组中变量可能取值的上限和下限。确定组限的原则是“不重不漏”,使每一数据都能够被分配到其中一组里,并且只能分配到其中一组里。组限的具体形公式有间断组限和

15、重合组限,闭口组限和开口组限。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.2 数据的分组,间断组限是每一组的组限与邻组的组限都是间断设置的。 重合组限是每一组的组限与邻组的组限都是相互重叠设置的。 在采用重合组限场合,为了贯彻“不重不漏”原则,一般采用“上限不在内”统计惯例的处理方式。 重合组限既适用于离散变量数据的分组,也适用于连续变量数据分组,在各种场合能够适应各种数据分组的需要,同时有利于组中值的计算,所以重合组限在数据分组中得到了广泛的应用。 闭口组限是既有上限又有下限的组限设置。由闭口组限设置形成的数据分组称为闭口组。 开口组限是缺少上限或者缺

16、少下限的组限设置。由开口组限设置形成的数据分组称为开口组。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.2 数据的分组,(5)将原始数据按照各自数值大小分配到各组中。 组限确定之后,就可以将原始数据按照各自数值大小分配到各组中。 一般先按照分组标志对原始数据进行排序,然后根据各组的组限水平,将经过排序之后的有序数据进行分段,归入到各个组中。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.2 数据的分组,3.2.4 组中值 组中值(Class Midpoint)是指组距分组中处在各组取值范围中点位置上的数值。 组中值是一个

17、代表性的数值,用来代表该组数据取值的一般水平。 在缺乏原始数据,仅拥有已经过分组整理后的数据情况下,只能采用组中值取代组平均数,作为一个代表性的数值,进行各种数据分析。 组中值作为代表性数值所隐含的假定前提是该组数据呈均匀分布,或者对称分布。在该组数据明显偏离均匀分布,或者对称分布时,使用组中值作为该组数据取值代表性数值存在着较大偏误。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.2 数据的分组,(1)重合组限分组的组中值计算。 在采用重合组限设置的组距分组中,组中值为本组的上限与本组下限之和除以2。有 组中值(上限+下限)/ (3.3) (2)间断组限分

18、组的组中值计算。 在采用间断组限设置的组距分组中,计算组中值需要将以上一组的下限与本组的下限之和除以2。即有 组中值(上组下限+本组下限 )/ (3.4),2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.2 数据的分组,(3)开口组组中值的计算 计算开口组组中值,需先确定其缺少的下限或上限。一般以邻组组距近似地作为本组的组距,来确定其下限或上限,进而计算出开口组组中值。开口组组中值的计算仍然要区分重合组限设置间断组限设置两种情况。 重合组限设置开口组组中值的计算 缺少下限组的组中值该组上限邻组组距/2 缺少上限组的组中值该组下限邻组组距/2 (3.5),201

19、9年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.2 数据的分组,表3.4 2003年我国按年龄和性别分人口数及组中值,第3章 数据整理和频数分布,3.3 数据的频数分布,统计学教程 卢小广,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.3 数据的频数分布,3.3.1 频数与频数分布 频数与频数分布是在数据分组基础形成的概念。频数与频数分布总是在具体的分组设置前提下的对总体数据分布特征的描述。 频数(Frequence)是落在某一特定分组中的数据个数,也称为次数。频数有两点要素,一是具体的数据分组,一是落在该组中的数据个数。 频数分

20、布(Frequence Distribution)是由各组的频数组成的一个数组。一般需要用统计图或统计表的形式将频数分布展示出来,以便更加直观和全面地了解和把握总体的频数分布特征。 比例(Proportion)各组数据个数(频数)占数据总数(各组频数之和)的比重,为频数的相对形式,又称为频率,一般用百分数表示。显然有,各组比例之和等于100%。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.3 数据的频数分布,表3.5 2001-2003年我国按性别分人口数及构成 本表各年人口未包括香港、澳门特别行政区和台湾省的人口数据。 资料来源:2004中国统计年鉴.

21、北京. 中国统计出版社 2004,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.3 数据的频数分布,表3.5 2001-2003年我国按性别分人口数及构成 本表各年人口未包括香港、澳门特别行政区和台湾省的人口数据。 资料来源:2004中国统计年鉴. 北京. 中国统计出版社 2004,统计分组,分配在各组的单位数及其相对形式,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.3 数据的频数分布,表3.5 2001-2003年我国按性别分人口数及构成 本表各年人口未包括香港、澳门特别行政区和台湾省的人口数据。 资料来源:2004中

22、国统计年鉴. 北京. 中国统计出版社 2004 讨论题 统计学中,分配在各组的单位数及其相对形式称为什么?,统计分组,分配在各组的单位数及其相对形式,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.3 数据的频数分布,3.3.2 累积频数 累积频数(Cumulative Frequence)按照各组数据取值范围高低的次序,逐组依次累加得到的一组频数。累积频数表明了在某一数值水平以上,或以下总共包含的数据个数。 依据逐组累加次序是从最低的数据取值范围组依次向较高组进行,还是从最高的数据取值组依次向较低组进行,可以将累积频数分为向下累积和向上累积。从最高的数据取值

23、组开始,依次向较低组进行累加所形成的累积频数称为向下累积频数,表明了各组下限以上的数据个数之和;从最低的数据取值组开始,依次向较高组进行累加所形成的累积频数称为向上累积频数,表明了各组上限以下总共包含的数据个数。 同样,可以用数据总的个数分别去除各组的累积频数,得到各组累积频数的相对数值,以相对的形式来描述累积频数。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.3 数据的频数分布,3.3.3 异距分组与标准组距频数 由于异距分组中各组组距不尽相等,各组频数之间不具有直接的可比性,不能直接用来描述数据的分布特征,需要进行标准化处理。 一般可以用某一组组距作为

24、标准组距,将各组不等组距频数,换算为统一的,以标准组距为组距条件下的,标准化了的标准组距频数。即 标准组距频数该组频数标准组距/该组组距 该组频数组距标准化系数 (3.7) 还可以通过计算频数密度,来进行异距分组的标准化,即 频数密度该组频数/该组组距 (3.8) 显然,所谓频数密度是单位组距作为标准组距,即标准组距为1的情况下的标准组距频数。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.3 数据的频数分布,校正后的数据,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.3 数据的频数分布,校正后的数据,2019年6月20日

25、/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.3 数据的频数分布,统计分组的要点和基本概念: 统计分组 基本概念:R、d、H、组中值; 间断组距、重合组距、开口组、闭口组、标准组距; 频数、频数分布、频率、累积频数、累积频率。,非数值型数据分组,数值型数据分组,单变量分组,组距分组,等距分组,异距分组,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.3 数据的频数分布,P.46 数值型数据的整理:某学期某班学生的考试成绩数据的整理 例3.1 某学期某班35名学生的统计学考试成绩的原始数据如下: 92,87,75,74,65,91,98,78,8

26、4,83,78,96,62,84,76, 52,69,84,81,88,70,91,89,87,75,79,82,86,79,82, 64,90,56,84,89, 要求 对该班学生的统计学考试成绩,采用重合组限和开口组限设置进行等距分组、计算组中值和频数分布,编制统计表和统计图。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,Excel 应用,例3.1 某学期某班35名学生的统计学考试成绩的原始数据如下: 92,87,75,74,65,91,98,78,84,83,78,96,62,84,76, 52,69,84,81,88,70,91,89,87,75,79

27、,82,86,79,82, 64,90,56,84,89, 1、计算取值范围,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,Excel 应用,例3.1 某学期某班35名学生的统计学考试成绩的原始数据如下: 92,87,75,74,65,91,98,78,84,83,78,96,62,84,76, 52,69,84,81,88,70,91,89,87,75,79,82,86,79,82, 64,90,56,84,89, 1、计算取值范围 排序、确定最大值和最小值为98和52,计算得R=46(分) 2、确定组数和组距,2019年6月20日/上午8时21分,统计学教程

28、 第3章 数据整理和频数分布,Excel 应用,例3.1 某学期某班35名学生的统计学考试成绩的原始数据如下: 92,87,75,74,65,91,98,78,84,83,78,96,62,84,76, 52,69,84,81,88,70,91,89,87,75,79,82,86,79,82, 64,90,56,84,89, 1、计算取值范围 排序、确定最大值和最小值为98和52,计算得R=46(分) 2、确定组数和组距 H=5,d=46/5=9.11(分),取整后d为10分。 3、计算频数分布,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,Excel 应用,例

29、3.1 某学期某班35名学生的统计学考试成绩的原始数据如下: 92,87,75,74,65,91,98,78,84,83,78,96,62,84,76, 52,69,84,81,88,70,91,89,87,75,79,82,86,79,82, 64,90,56,84,89, 3、计算频数分布 98、96、92、91、91、90 89、89、88、87、87、86、84、84、84、84、83、82、82、81 79、79、78、78、76、75、75、74、70 69、65、64、62 56、52,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,Excel 应用

30、,例3.1 某学期某班35名学生的统计学考试成绩的原始数据如下: 92,87,75,74,65,91,98,78,84,83,78,96,62,84,76, 52,69,84,81,88,70,91,89,87,75,79,82,86,79,82, 64,90,56,84,89, 3、计算频数分布(上限不在内) 98、96、92、91、91、90 (共6人) 89、89、88、87、87、86、84、84、84、84、83、82、82、81(共14人) 79、79、78、78、76、75、75、74、70(共9人) 69、65、64、62(共4人) 56、52(共2人),2019年6月20日/

31、上午8时21分,统计学教程 第3章 数据整理和频数分布,Excel 应用,例3.1 某学期某班35名学生的统计学考试成绩的原始数据如下: 92,87,75,74,65,91,98,78,84,83,78,96,62,84,76, 52,69,84,81,88,70,91,89,87,75,79,82,86,79,82, 64,90,56,84,89, 1、计算取值范围 排序、确定最大值和最小值为98和52,计算得R=46(分) 2、确定组数和组距 H=5,d=46/5=9.11(分),取整后d为10分。 3、计算频数分布 4、计算组中值,第3章 数据整理和频数分布,3.4 绝对数,统计学教程,

32、2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.4 绝对数,3.4.1 绝对数的概念 绝对数(Absolute Data)是反映总体绝对规模和绝对水平的测度,是通过数据汇总直接得到的测度。绝对数数值的大小与界定的总体的范围有直接的联系,两者呈同方向变化。 数据整理的结果就是产生总体及其各分组的绝对数。就数值型数据而言,数据整理的成果表现为两个方面,一方面是数据个数的频数,反映数据分布状态和数据值的总规模;另一方面是数据值的总值,反映数据值的总水平。 由数据整理形成绝对数是基础数据,其它数据都是在绝对数基础上衍生出来的派生数据。 在经济管理中,绝对数是反映现象在

33、一定时间、地点、条件下的总规模和总水平的综合数据,有着特别重要的地位。一个国家、地区或单位的基本情况通常要通过绝对数来反映。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.4 绝对数,3.4.2 绝对数的种类 1总值和频数。 总值(Total Value)为总体内所有数据某一数字变量的取值之和。总值是说明总体某一数量特征总水平的数据。 频数为总体内所有数据个数之和。频数是说明总体分布状态及其规模大小的数据。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.4 绝对数,2时期数据和时点数据 时期数据(Period Data)是

34、反映事物及其现象在某一指定时间区段内的发展过程中的累计总量的数据。 时点数据(Point Data)是反映事物及其现象在某一指定瞬间状态下的具体水平的数据。 三点区别: 时期数据体现的时间概念是一个时间区间,时点数据的时间概念是一个瞬间时点; 时期数据具有累加性,时点数据不具有累加性; 时期数据的数值大小与时间长短直接相关,其数值大小直接受现象活动时间长短的制约;而时点数据与时间间隔长短没有直接的关系。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.4 绝对数, 讨论题 举例解释时期数据和时点数据。,2019年6月20日/上午8时21分,统计学教程 第3章

35、数据整理和频数分布,3.4 绝对数, 讨论题 举例解释时期数据和时点数据。 讨论题 区分以下的数据为时期数据,或者时点数据,为什么? 人口总数、出生人口数、新增人口数 固定资产总值、固定资产折旧、,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.4 绝对数,3截面数据和时间序列数据。 截面数据(Cross-Sectional Data)在相同的时期内或相同的时点上搜集的数据,反映同一时间上的变量在不同空间上的差异。例如,同一年份不同国家和地区国内生产总值数据,或者全国各个省市自治区的国内生产总值数据等。 时间序列数据(Time-Sectional Data)在

36、同一空间上,不同的时期或不同的时点的数据,反映变量在不同时间上的变动。例如,我国各年国内生产总值数据,人口数据等。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.4 绝对数,3截面数据和时间序列数据。 截面数据(Cross-Sectional Data)在相同的时期内或相同的时点上搜集的数据,反映同一时间上的变量在不同空间上的差异。例如,同一年份不同国家和地区国内生产总值数据,或者全国各个省市自治区的国内生产总值数据等。 时间序列数据(Time-Sectional Data)在同一空间上,不同的时期或不同的时点的数据,反映变量在不同时间上的变动。例如,我国各

37、年国内生产总值数据,人口数据等。 面板数据(Panel Data)为截面数据和时间序列数据的综合数据,在不同空间和不同的时期或不同的时点的数据。按照时间序列排列的截面数据。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.4 绝对数,表3.6 2001-2003年我国国内生产总值 亿元 本表按当年价格计算。 资料来源:2004中国统计年鉴. 北京. 中国统计出版社 2004 讨论题 根据以上绝对数种类的划分方法,试分析表3.6中2001-2003年我国国内生产总值数据。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.4 绝对

38、数,3.4.3 绝对数的计量单位 绝对数是反映总体绝对规模和绝对水平的数据,都具有具体计量单位。 计量单位是绝对数数值的尺度,数量的度量工具。计量单位和绝对数数值是绝对数的缺一不可的两个组成要素,两者有机结合在一起,共同反映总体绝对规模和绝对水平。计量单位又称为量纲。 绝对数的计量单位都为有名数,可分为实物单位、货币单位及时间单位三种。据此,绝对数也可相应分为实物量数据、价值量数据和劳动量数据。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.4 绝对数,1、实物单位。 实物单位(Goods Unit)实物单位是指根据现象的自然或物理属性而规定的计量单位。也称

39、为使用价值量单位。具体有自然单位,例如总人口数按“人”;度量衡单位,例如煤产量以“吨”或“标准吨”;以及双重单位、多重单位和复合单位,例如货运量以“吨公里”等。 采用实物单位为计量单位的绝对数称为实物量数据,也称为使用价值量数据。实物数据的特点是能够直接地反映事物的具体内容,但综合能力差。不同的实物具有不同的使用价值;不同的使用价值无法直接汇总,从而不能全面和概括地反映复杂总体的总规模或总水平。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.4 绝对数,1、实物单位。 实物单位(Goods Unit)实物单位是指根据现象的自然或物理属性而规定的计量单位。也称

40、为使用价值量单位。具体有自然单位,例如总人口数按“人”;度量衡单位,例如煤产量以“吨”或“标准吨”;以及双重单位、多重单位和复合单位,例如货运量以“吨公里”等。 采用实物单位为计量单位的绝对数称为实物量数据,也称为使用价值量数据。实物数据的特点是能够直接地反映事物的具体内容,但综合能力差。不同的实物具有不同的使用价值;不同的使用价值无法直接汇总,从而不能全面和概括地反映复杂总体的总规模或总水平。 讨论题 实物单位的局限性?,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.4 绝对数,2、货币单位。 货币单位(Monetary Unit)是指以货币作为价值尺度对

41、社会财富和劳动成果进行计算的计量单位。货币单位又称为价值量单位。如国内生产总值、总成本、销售总额等。 采用货币单位为计量单位的绝对数称为货币量数据,也称为价值量数据。与实物量数据相反,价值量数据的突出特点就是它隐去了现象的具体物质内容,具有很强的综合能力。在实际使用时要充分注意它的这个特点,尤其要防止使用不当混淆事物的本质特征。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.4 绝对数,2、货币单位。 货币单位(Monetary Unit)是指以货币作为价值尺度对社会财富和劳动成果进行计算的计量单位。货币单位又称为价值量单位。如国内生产总值、总成本、销售总额

42、等。 采用货币单位为计量单位的绝对数称为货币量数据,也称为价值量数据。与实物量数据相反,价值量数据的突出特点就是它隐去了现象的具体物质内容,具有很强的综合能力。在实际使用时要充分注意它的这个特点,尤其要防止使用不当混淆事物的本质特征。 讨论题 通货膨胀对货币单位的影响?,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.4 绝对数,2、货币单位。 货币单位(Monetary Unit)是指以货币作为价值尺度对社会财富和劳动成果进行计算的计量单位。货币单位又称为价值量单位。如国内生产总值、总成本、销售总额等。 采用货币单位为计量单位的绝对数称为货币量数据,也称为价

43、值量数据。与实物量数据相反,价值量数据的突出特点就是它隐去了现象的具体物质内容,具有很强的综合能力。在实际使用时要充分注意它的这个特点,尤其要防止使用不当混淆事物的本质特征。 讨论题 通货膨胀对货币单位的影响? 讨论题 汇率变动对货币单位的影响?,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.4 绝对数,3、时间单位 时间单位(Time Unit)一般用劳动时间的长短来度量,一般以复合单位的形式出现。如工时、工日等。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.4 绝对数,3、时间单位 时间单位(Time Unit)一般

44、用劳动时间的长短来度量,一般以复合单位的形式出现。如工时、工日等。 讨论题 时间单位的局限性?,第3章 数据整理和频数分布,3.5 数据的展示,统计学教程,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.5 数据的展示,3.5.1 统计表 统计表是展示数据的基本工具。通过统计表不仅能够将统计数据条理化地呈现出来,还可以通过同一张统计表中的数据之间的数量对等关系,来反映事物内部的相互关联,使原本单独杂乱的数据变为有序和清晰。 1统计表的构成 从形式上看,统计表由表头、行标题、列标题和数据4个主要部分内容组成。此外,在需要时做某些说明时,可以在表的上下端加上附注。

45、 2统计表的种类 按其用途不同,统计表可分为调查表、整理表(又称汇总表)和分析表。 按其分组方式不同,统计表可分为简单表、简单分组表和复合分组表。 按其表述的内容不同, 统计表可分为时间分组表、空间分组表和时空分组结合表。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.5 数据的展示,3统计表的绘制 (1)统计表的表头 (2)统计表的标题 (3)统计表的表式 (4)统计表的计量单位 (5)统计表的填表要求 (6)统计表的的注释,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.5 数据的展示,3.5.2 统计图 1非数值型数据

46、的统计图 非数值型数据通常使用的统计图有条形图和饼图。 (1)条形图(Bar Chart)是以一簇宽度相等、相互分离的条状图形的长度(或高度)来表示频数分布的统计图。当以条状图形的高度来表示频数分布特征时,条形图也称为柱形图。条形图中条状图形的长度(或高度)所表示的数据可以是频数,也可以是频数的相对比例,还可以是事物具体的数值水平等。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.5 数据的展示,图3.1 2003年我国按性别分人口数柱形图,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.5 数据的展示,图3.2是根据表3.

47、6中我国2003年国内生产总值数据绘制的条形图 图3.2 2003年我国国内生产总值条形图,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.5 数据的展示,(2)饼图(Pie Chart)是以同一圆形内一簇扇形的面积的大小来表示数值分布的统计图。 图3.2是根据表3.6中我国2003年国内生产总值数据绘制的饼图。 图3.3 2003年我国国内生产总值饼图,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.5 数据的展示,2、 数值型数据的统计图 数值型数据常用的有直方图和折线图。 (1)直方图(Histogram)是以各组的组距

48、为宽, 以各组的频数为高, 在直角坐标系的第一象限依次绘制一系列矩形来表示频数分布状态的统计图。 直方图与条形图的本质区别在于直方图的矩形宽度是数值型数据分组的组距,并且在直方图的直角坐标系中直接标明了每一分组的上限和下限。所以,直方图的矩形一般是连续的方式相继排列,不同于条形图一般是以间断的方式分隔排列。 对于异距分组,绘制直方图时应以各组的实际组距为宽,以相应的标准组距频数,或频数密度为高。,2019年6月20日/上午8时21分,统计学教程 第3章 数据整理和频数分布,3.5 数据的展示,(2)折线图(Line Graph)是将各组的组中值和频数在直角坐标系的点,用一条折线联系起来,以反映频数分布状态的统计图。 折线图从最低数值组的下限减去二分之一最低数值组组距的位置起点,终点为最高数值组的上限加上二分之一最高数值组组距的位置,从而使折线图中的折线与直角坐标系的横轴所围的面积同直方图的矩形所围的面积相等。 折线图也可以在直方图的基础上绘制,用直线依次连接直方图各矩形顶边的中点,并在直方图的左右两端各延伸一个假定分组,使折线在假定分组的中

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1