数据的采集与整理PPT课件.ppt

上传人:peixunshi0 文档编号:101296 上传时间:2025-07-10 格式:PPT 页数:44 大小:543.50KB
下载 相关 举报
数据的采集与整理PPT课件.ppt_第1页
第1页 / 共44页
数据的采集与整理PPT课件.ppt_第2页
第2页 / 共44页
数据的采集与整理PPT课件.ppt_第3页
第3页 / 共44页
数据的采集与整理PPT课件.ppt_第4页
第4页 / 共44页
数据的采集与整理PPT课件.ppt_第5页
第5页 / 共44页
点击查看更多>>
资源描述

1、第二章第二章 数据的采集与整理数据的采集与整理学习要点学习要点 本章是实物操作的第一阶段,应掌握以下几点:本章是实物操作的第一阶段,应掌握以下几点:一、数据的直接来源包括:统计调查和科学试验。一、数据的直接来源包括:统计调查和科学试验。二、统计分组与汇总,编制变量分布数列。二、统计分组与汇总,编制变量分布数列。三、统计数据的显示。三、统计数据的显示。第一节第一节 统计数据的采集统计数据的采集 图图2-12-1简明扼要地展示了数据的来源简明扼要地展示了数据的来源图图2-1 2-1 数据来源数据来源一、统计数据的直接来源一、统计数据的直接来源 (一)统计调查(一)统计调查 统计调查的组织形式入图统

2、计调查的组织形式入图2-22-2所示:所示:全面统计报表全面统计报表 调查调查 全面调查全面调查 普普 查查 范围范围 抽样调查抽样调查 统统 非全面调查非全面调查 重点调查重点调查 计计 典型调查典型调查 调调 调查调查 连续(经常性)调查连续(经常性)调查 查查 时间时间 不连续调查不连续调查 周期性调查周期性调查 形形 一次性调查一次性调查 式式 定期报表定期报表 普普 查查 组织组织 抽样调查抽样调查 形式形式 专门调查专门调查 重点调查重点调查 典型调查典型调查图图 2-22-2 1.1.统计报表制度统计报表制度 它是依照国家有关法规它是依照国家有关法规,自上而下统一布置自上而下统一

3、布置,以一定的原始记以一定的原始记录为依据录为依据,按照统一表式、统一项目、统一报送时间和程序,自按照统一表式、统一项目、统一报送时间和程序,自下而上定期提供统计资料的调查组织方式。下而上定期提供统计资料的调查组织方式。它的特点是:它的特点是:(1 1)资料来源于基层单位原始记录。)资料来源于基层单位原始记录。(2 2)逐级上报和汇总。)逐级上报和汇总。(3 3)多为经常性调查。)多为经常性调查。分为全面报表和非全面报表两种。分为全面报表和非全面报表两种。2.2.普查普查 为了解某种事物在一定时点上的状况,而专门组织的一次性为了解某种事物在一定时点上的状况,而专门组织的一次性全面调查。全面调查

4、其特点是:其特点是:(1 1)它是间断性调查,如逢)它是间断性调查,如逢“0 0”年份人口普查,逢年份人口普查,逢“3 3”年年份三产普查,逢份三产普查,逢“5 5”年份工业普查,逢年份工业普查,逢“7 7”年份农业普查等。年份农业普查等。主要用于采集一定时点上的全面数据。主要用于采集一定时点上的全面数据。组织形式:组织形式:(1 1)建立专门普查机构和普查人员,对普查单位逐一登记。)建立专门普查机构和普查人员,对普查单位逐一登记。如表如表2-12-1所示。所示。表表2-1 2-1 人口普查表人口普查表 本户本户 省市省市 县县 乡乡 村村 住址自治区市街道居委会居民小组(街巷住址自治区市街

5、道居委会居民小组(街巷 号)号)申报人普查员填报日期户主姓名申报人普查员填报日期户主姓名 (2 2)被调查单位依据原始记录和核算资料,结合清库盘点,)被调查单位依据原始记录和核算资料,结合清库盘点,自行填报调查表。如工业普查、三产普查、农业普查、统计单位自行填报调查表。如工业普查、三产普查、农业普查、统计单位普查和财产普查等等。普查和财产普查等等。姓姓名名与户与户主关主关系系性性别别年年龄龄民民族族常住人常住人口户口口户口登记状登记状况况文化文化程度程度行行业业职职业业不在不在业人业人口状口状况况婚姻婚姻状况状况生育子生育子女总数女总数和存活和存活子女总子女总数数上年上年生育生育状况状况1 1

6、2 23 34 45 56 67 78 89 91010111112121313 3.3.抽样调查抽样调查 从总体中抽取部分单位作为样本进行调查从总体中抽取部分单位作为样本进行调查,根据所获得的样根据所获得的样本数据估计总体相应数据本数据估计总体相应数据,作出具有一定可靠程度的推断的统计作出具有一定可靠程度的推断的统计方法。方法。它的特点是:它的特点是:(1 1)按随机原则抽取样本单位,排除了主观因素的影响。)按随机原则抽取样本单位,排除了主观因素的影响。(2 2)用样本数据推算总体相应数据。)用样本数据推算总体相应数据。(3 3)抽样误差可以事先计算并加以控制,具有一定置信度。)抽样误差可以

7、事先计算并加以控制,具有一定置信度。随机原则:随机原则:完全排除主观因素,每个单位机会均等,抽中与否全凭偶然。完全排除主观因素,每个单位机会均等,抽中与否全凭偶然。具体操作在第四章中详细介绍。具体操作在第四章中详细介绍。4.4.重点调查重点调查 它是对总体中重点单位进行调查它是对总体中重点单位进行调查,取得反映总体基本数据的取得反映总体基本数据的调查方法。调查方法。重点单位:它是重点单位数占总体单位数比重小,他们的标重点单位:它是重点单位数占总体单位数比重小,他们的标志值之和占总体标志值总量的比重大,有举足轻重的作用。例如志值之和占总体标志值总量的比重大,有举足轻重的作用。例如农作物产量调查、

8、成交额调查、利税额调查等可颁发调查表进行农作物产量调查、成交额调查、利税额调查等可颁发调查表进行调查。调查。5.5.典型调查典型调查 对调查对象进行分类划点的基础上,有意识挑选具有代表性对调查对象进行分类划点的基础上,有意识挑选具有代表性的单位进行深入细致的调查。有好典型与坏典型之分。的单位进行深入细致的调查。有好典型与坏典型之分。(二)采集统计数据的具体操作方法(二)采集统计数据的具体操作方法 是指从调查单位上取得统计数据的具体做法。是指从调查单位上取得统计数据的具体做法。1.1.直接观察法直接观察法 调查人员深入现场进行观察、计数、登记、检验等,取得第调查人员深入现场进行观察、计数、登记、

9、检验等,取得第一手资料。一手资料。2.2.报告法报告法 被调查单位依据原始记录、核算资料、清查盘点,填报统计被调查单位依据原始记录、核算资料、清查盘点,填报统计数据。数据。3.3.访问法访问法 调查者通过口头、邮件、网络、报纸杂志等方式向被调查者调查者通过口头、邮件、网络、报纸杂志等方式向被调查者采集数据。采集数据。4.4.问卷法问卷法 利用统一设计的答卷向被调查者采集统计资料。利用统一设计的答卷向被调查者采集统计资料。(三)调查方案设计(三)调查方案设计 统计调查方案一般包括以下内容:统计调查方案一般包括以下内容:1.1.调查目的调查目的 指在调查中需要解决哪些问题指在调查中需要解决哪些问题

10、采集什么资料。采集什么资料。2.2.调查对象与调查单位调查对象与调查单位 调查对象是指根据调查目的所确定的调查总体;调查单位指调查对象是指根据调查目的所确定的调查总体;调查单位指在调查对象中所要调查的具体单位。在调查对象中所要调查的具体单位。3.3.调查单位和调查表调查单位和调查表 调查提纲是指根据调查目的所列示出的调查项目,主要是标调查提纲是指根据调查目的所列示出的调查项目,主要是标志、指标和指标体系。将调查项目按一定顺序排列在表格中形成志、指标和指标体系。将调查项目按一定顺序排列在表格中形成调查表。调查表。4.4.调查时间与期限调查时间与期限 调查时间是指资料所属时间;调查期限是指完成调

11、查工作所调查时间是指资料所属时间;调查期限是指完成调查工作所需时间。需时间。5.5.组织实施计划组织实施计划 指调查工作的行动部署与具体活动安排。主要包括领导机构指调查工作的行动部署与具体活动安排。主要包括领导机构建立、调查步骤、参调单位与人员、人员培训与试点、汇总整理建立、调查步骤、参调单位与人员、人员培训与试点、汇总整理办法、资料报送、经费开支和预算等等。办法、资料报送、经费开支和预算等等。(四)试验(四)试验 对客观现象的科学观察和科学实验统称为试验。对客观现象的科学观察和科学实验统称为试验。1.1.对照实验对照实验 设计一个实验来测试某被调查对象的数据,是在一次真实的设计一个实验来测试

12、某被调查对象的数据,是在一次真实的现场实验中逐步展开,在调查人员控制之下的活动过程,来获取现场实验中逐步展开,在调查人员控制之下的活动过程,来获取统计数据。统计数据。2.2.观察研究观察研究 设计一个调研人员控制之外的实验过程,而调研者只是把观设计一个调研人员控制之外的实验过程,而调研者只是把观察所发生的情况记录下来。察所发生的情况记录下来。3.3.促销实验促销实验 在一定条件下在一定条件下,在一定范围内在一定范围内,对某种新产品试销或赠送来摸对某种新产品试销或赠送来摸清用户的反映。清用户的反映。4.4.改革实验改革实验 建立社会主义市场经济体制需要经验,经验不足,就需要通建立社会主义市场经济

13、体制需要经验,经验不足,就需要通过建立实验区来获得有关数据,推动改革进程。过建立实验区来获得有关数据,推动改革进程。二、统计数据的间接来源二、统计数据的间接来源 统计数据的间接来源是指利用他人调查或试验所得的数据,统计数据的间接来源是指利用他人调查或试验所得的数据,也称次级调查。一般是通过案头作业方式来完成。目前,实施次也称次级调查。一般是通过案头作业方式来完成。目前,实施次级调查较好的部门有:交易市场调查、金融市场调查、海关统计级调查较好的部门有:交易市场调查、金融市场调查、海关统计调查、财税管理调查、工商城管统计调查等。调查、财税管理调查、工商城管统计调查等。具体渠道有:具体渠道有:(一)

14、查阅有关出版物(一)查阅有关出版物 (二)向政府统计结构或调查公司咨询(二)向政府统计结构或调查公司咨询 (三)网上查询(三)网上查询 本节小节本节小节 1.1.全面调查与非全面调查的区别:是以所包含的调查单位是全面调查与非全面调查的区别:是以所包含的调查单位是总体的全部还是部分为依据,而不是以最后得到的是否为全面资总体的全部还是部分为依据,而不是以最后得到的是否为全面资料为依据。因为有的非全面调查其目的仍然是获取总体数据,如,料为依据。因为有的非全面调查其目的仍然是获取总体数据,如,抽样调查。抽样调查。2.2.经常性调查和一次性调查的区别:是以调查数据的登记在经常性调查和一次性调查的区别:是

15、以调查数据的登记在时间上是否具有连续性为依据。经常性调查是指一段时期内的流时间上是否具有连续性为依据。经常性调查是指一段时期内的流量;一次性调查是指某时点上的存量。如表量;一次性调查是指某时点上的存量。如表2-12-1所示。所示。表表2-1 2-1 统计调查小结统计调查小结全面调查或全面调查或非全面调查非全面调查连续调查或连续调查或不连续调查不连续调查观察、凭观察、凭证、询问证、询问1.1.某市公共卫生设施调查某市公共卫生设施调查全面调查全面调查不连续调查不连续调查 直接观察直接观察2.2.某厂技术人员居住条件调查某厂技术人员居住条件调查全面调查全面调查不连续调查不连续调查 询问调查询问调查3

16、3.某厂产量计划完成情况月报某厂产量计划完成情况月报全面调查全面调查连续调查连续调查凭证调查凭证调查4.4.集贸市场成交价格调查集贸市场成交价格调查 (每月(每月2525日登记日登记)非全面调查非全面调查 不连续调查不连续调查 询问调查询问调查5.5.某市居民对服务行业的意见某市居民对服务行业的意见 非全面调查非全面调查 不连续调查不连续调查 询问调查询问调查6.6.商店销售额核算商店销售额核算全面调查全面调查连续调查连续调查凭证调查凭证调查7.7.全国人口普查全国人口普查全面调查全面调查不连续调查不连续调查 询问调查询问调查8.8.商店商品盘点商店商品盘点全面调查全面调查不连续调查不连续调

17、查 直接观察直接观察9.9.产品质量破坏性检验产品质量破坏性检验非全面调查非全面调查 不连续调查不连续调查 直接观察直接观察 3.3.重点、典型、抽样调查的区别:重点、典型、抽样调查的区别:三者都是非全面调查,它们的区别如表三者都是非全面调查,它们的区别如表2-22-2所示。所示。表表2-22-2 调查方式调查方式调查目的调查目的调查单位调查单位重点调查重点调查了解被研究对象基本情况了解被研究对象基本情况不能推算总体相应数据。不能推算总体相应数据。它们的单位数比重小,但标它们的单位数比重小,但标志值比重大。志值比重大。典型调查典型调查了解典型事物特征规律近了解典型事物特征规律近似推算总体无法估

18、计误差似推算总体无法估计误差有意识选取具有代表性的典有意识选取具有代表性的典型单位,有好、坏典型之分型单位,有好、坏典型之分抽样调查抽样调查用样本数据估计总体相应用样本数据估计总体相应数据误差可以计算和控制数据误差可以计算和控制按随机原则抽取样本单位,按随机原则抽取样本单位,有大样本与小样本之分有大样本与小样本之分 4.4.调查单位与报告单位的区别:调查单位与报告单位的区别:二者区别如表二者区别如表2-32-3所示。所示。表表2-32-3调查对象调查对象调查单位调查单位报告单位报告单位两者区别两者区别科研机构调查科研机构调查所有单位所有单位每个单位每个单位科研单位科研单位一致一致工业设备普查工

19、业设备普查所有设备所有设备每个设备每个设备工业企业工业企业不一致不一致进出口质检进出口质检所有商品所有商品每种商品每种商品质检部门质检部门不一致不一致项目投资调查项目投资调查全部项目全部项目每个项目每个项目投资单位投资单位不一致不一致居民收支调查居民收支调查全部居民全部居民每户居民每户居民每户居民每户居民一致一致国企效益调查国企效益调查所有国企所有国企每个国企每个国企每个国企每个国企一致一致食品价格调查食品价格调查所有商品所有商品每种食品每种食品每个商家每个商家不一致不一致第二节第二节 统计数据的整理统计数据的整理 信息必然是数据,但数据未必是信息。信息是数据的一个子信息必然是数据,但数据未必

20、是信息。信息是数据的一个子集,只有经过加工整理的数据才能成为信息。本节具体介绍统计集,只有经过加工整理的数据才能成为信息。本节具体介绍统计数据的加工整理,使之生成统计信息的具体操作。数据的加工整理,使之生成统计信息的具体操作。一、统计数据整理的意义和内容一、统计数据整理的意义和内容 (一)统计数据整理的意义(一)统计数据整理的意义 根据统计研究目的和任务,对统计调查或科学试验所获得的根据统计研究目的和任务,对统计调查或科学试验所获得的原始数据进行科学分类、汇总计算,或对次级资料进行再加工,原始数据进行科学分类、汇总计算,或对次级资料进行再加工,使之生成系统化、条理化、标准化来反映总体数量特征与

21、数量关使之生成系统化、条理化、标准化来反映总体数量特征与数量关系的操作过程。系的操作过程。通过统计调查或科学试验所获得的原始数据只能说明总体各通过统计调查或科学试验所获得的原始数据只能说明总体各单位的具体情况,不能反映总体综合特征。因此,必须通过科学单位的具体情况,不能反映总体综合特征。因此,必须通过科学整理才能成为统计信息。整理才能成为统计信息。(二)统计数据整理的内容与步骤(二)统计数据整理的内容与步骤 1.1.设计整理方案设计整理方案 主要明确规定出统计分组的方法和要汇总的统计指标与指标主要明确规定出统计分组的方法和要汇总的统计指标与指标体系。体系。2.2.数据审查数据审查 主要审核原始

22、资料的准确性和完整性。主要审核原始资料的准确性和完整性。3.3.数据分组数据分组 根据统计研究的要求,按照选定的分组标志,将审核后的原根据统计研究的要求,按照选定的分组标志,将审核后的原始数据进行分类或分组。始数据进行分类或分组。4.4.数据汇总与计算数据汇总与计算 对分组后的数据进行汇总与计算的方法主要有手工汇总和计对分组后的数据进行汇总与计算的方法主要有手工汇总和计算机汇总。算机汇总。(1 1)手工汇总)手工汇总 用算盘或电子计算器作为工具进行汇总计算。主要方法有划用算盘或电子计算器作为工具进行汇总计算。主要方法有划记法、过录法、折叠法和卡片法等。记法、过录法、折叠法和卡片法等。这里主要介

23、绍这里主要介绍划记法或过录法。划记法或过录法。划记法:在事先设计好的汇总表上用点、线或划划记法:在事先设计好的汇总表上用点、线或划“正正”字字的方法进行分组汇总计算并将结果填入正式统计表中。的方法进行分组汇总计算并将结果填入正式统计表中。过录法:把调查表中资料一一过录到事先设计好的表格中过录法:把调查表中资料一一过录到事先设计好的表格中然后进行汇总计算。然后进行汇总计算。(2 2)电脑汇总)电脑汇总 电脑汇总大体分为六个步骤:电脑汇总大体分为六个步骤:编程编程编码编码录入录入检查检查制表打印制表打印数据存储。可采用数据存储。可采用SASSAS软件。软件。5.5.编制统计表、绘制统计图。编制统计

24、表、绘制统计图。二、统计分组二、统计分组 (一)统计分组的概念(一)统计分组的概念 根据统计研究的要求,按照选定的分组标志,将审核后的原根据统计研究的要求,按照选定的分组标志,将审核后的原始数据进行分组或分类。始数据进行分组或分类。统计分组应遵循统计分组应遵循“相同者合并,不同者分开相同者合并,不同者分开”的原则,将相的原则,将相同性质的个体划在同一组内,不同性质的个体划入不同组内,组同性质的个体划在同一组内,不同性质的个体划入不同组内,组与组之间的性质是不同的。与组之间的性质是不同的。理解统计分组的概念要明确以下三点:理解统计分组的概念要明确以下三点:1.1.统计分组的对象是总体;统计分组的

25、对象是总体;2.2.应有分组标志;应有分组标志;3.3.对总体而言是对总体而言是“分分”,总体单位而言是,总体单位而言是“合合”。(二)统计分组的作用(二)统计分组的作用 1.1.划分现象的类型;划分现象的类型;2.2.显示内部结构;显示内部结构;3.3.分析依存关系。分析依存关系。某企业职工情况某企业职工情况划分类型划分类型职称结构职称结构依存关系依存关系职称档次(级)职称档次(级)人数比重(人数比重(%)月薪收入(元)月薪收入(元)高级职称高级职称1.21.250005000中级职称中级职称14.514.530003000初级职称初级职称43.543.520002000无无 职职 称称40

26、840.812001200合合 计计100.0100.0 (三)统计分组方法(三)统计分组方法 统计分组的关键是选择分组标志与划分各组界限。选择分组统计分组的关键是选择分组标志与划分各组界限。选择分组标志是确定不同组的标准和依据;划分各组界限是确定相邻组的标志是确定不同组的标准和依据;划分各组界限是确定相邻组的性质界限或数量界限。性质界限或数量界限。1.1.按品质标志或数量标志分组按品质标志或数量标志分组 按品质标志分组就是用反映事物属性、性质的标志分组。例按品质标志分组就是用反映事物属性、性质的标志分组。例如,职工按职称分组、企业按部门分组、学生按性别分组等等。如,职工按职称分组、企业按部

27、门分组、学生按性别分组等等。按数量标志分组是用事物的量作为分组标志,它可以是绝对按数量标志分组是用事物的量作为分组标志,它可以是绝对数、相对数或平均数。数、相对数或平均数。2.2.按离散变量或连续变量分组按离散变量或连续变量分组 它是根据变量取值类型来分组。离散变量分组,如企业按机它是根据变量取值类型来分组。离散变量分组,如企业按机器台数分组、旅馆按客房间数分组、医院按病床数分组等等。器台数分组、旅馆按客房间数分组、医院按病床数分组等等。连续变量分组,如商店按销售额分组、工厂按产值分组、学连续变量分组,如商店按销售额分组、工厂按产值分组、学生按考试成绩分组等等。生按考试成绩分组等等。3.3.简

28、单分组和复合分组简单分组和复合分组 简单分组是按一个标志分组;复合分组是按两个或两个以上简单分组是按一个标志分组;复合分组是按两个或两个以上标志分组。标志分组。三、变量分布数列三、变量分布数列 (一)变量分布数列的概念(一)变量分布数列的概念 统计分组的过程就是变量分布数列生成的过程。入图统计分组的过程就是变量分布数列生成的过程。入图2-32-3。图图 2-3 2-3 分布数列生成过程分布数列生成过程 将组别依次排列,同时列出各组单位数(频数)便生成变量将组别依次排列,同时列出各组单位数(频数)便生成变量分布数列。它有表格与图示两种显示方式。分布数列。它有表格与图示两种显示方式。(二)变量分布

29、数列的编制方法(二)变量分布数列的编制方法 1.1.单项式单项式变量分布数列的编制方法变量分布数列的编制方法 单项单项数列是把每个变量值作为一组所生成的数列。例如,数列是把每个变量值作为一组所生成的数列。例如,某生产组某生产组2020名工人同种产品日产量如下(单位:件)名工人同种产品日产量如下(单位:件):16 13 18 15 19 14 17 13 15 1716 13 18 15 19 14 17 13 15 17 19 15 17 18 14 16 15 16 17 1619 15 17 18 14 16 15 16 17 16 这是一个离散型变量,变量值不多、变动范围不大,宜编这是一

30、个离散型变量,变量值不多、变动范围不大,宜编制制单项式单项式变量分布数列。变量分布数列。(1 1)按变量值大小顺序排列:)按变量值大小顺序排列:13 13 1313 14 14 1414 15 15 1515 1515 1515 16 16 1616 16 16 1616 17 17 1717 1717 1717 18 18 1818 19 19 1919 (2 2)每种)每种变量量值为一一组(重复者只取一个)(重复者只取一个)顺序排列:序排列:13 14 15 16 17 18 1913 14 15 16 17 18 19 七七组 (3 3)列入表中并列入表中并汇总计算各算各组频数,数,见表

31、表2-42-4所示。所示。表表2-4 202-4 20名工人日产量资料(单项式)名工人日产量资料(单项式)日产量(件)日产量(件)工人数(人)(频数)工人数(人)(频数)频频 率率x xf ff/f/f f13132 22/202/2014142 22/202/2015154 44/204/2016164 44/204/2017174 44/204/2018182 22/202/2019192 22/202/20合计合计20201 1 将表将表2-42-4绘制成变量分布图绘制成变量分布图2-42-4。2.2.组距变量数列的编制方法组距变量数列的编制方法 例如,某班例如,某班4040名学生某科某

32、次考试成绩如下:名学生某科某次考试成绩如下:54 60 62 97 85 52 83 79 95 8054 60 62 97 85 52 83 79 95 80 89 85 77 68 86 93 70 81 78 89 89 85 77 68 86 93 70 81 78 89 71 89 80 85 75 78 90 66 78 73 71 89 80 85 75 78 90 66 78 73 82 82 8282 99 77 88 84 75 88 76 80 99 77 88 84 75 88 76 80 试编制等距数列。试编制等距数列。(1 1)将数据顺序排列,并判断变量性质。)将数

33、据顺序排列,并判断变量性质。52 54 60 62 66 68 70 71 73 7552 54 60 62 66 68 70 71 73 75 76 77 76 77 7777 78 78 7878 7878 79 80 79 80 8080 8080 81 82 81 82 8282 83 84 85 83 84 85 8585 8585 86 88 86 88 88 89 88 89 8989 8989 8989 90 93 95 97 99 90 93 95 97 99 变量性质为连续变量,宜编制组距式变量数列。变量性质为连续变量,宜编制组距式变量数列。(2 2)计算全距)计算全距 全

34、距全距 =最大变量值最大变量值 -最小变量值最小变量值 该班成绩全距该班成绩全距=99=99 52=47(52=47(分分)(3 3)确定组限、组距和组数)确定组限、组距和组数 组限是指每组的两端变量值,每个组的起点值称为下限,每组限是指每组的两端变量值,每个组的起点值称为下限,每个组的终点值称为上限。个组的终点值称为上限。组距是指上限值与下限值之差,即组距组距是指上限值与下限值之差,即组距 =上限值上限值 -下限值下限值 组数是指变量数列应划分为多少个组。组数是指变量数列应划分为多少个组。确定组距与祖数的具体方法如下:确定组距与祖数的具体方法如下:所使用的全距最小值应略低于实际资料的最小值,

35、自所使用的全距最小值应略低于实际资料的最小值,自5050分开分开始,最大值应略高于实际资料最大值,最大值取始,最大值应略高于实际资料最大值,最大值取100100分。则本例分。则本例全距为全距为100-50=50100-50=50。若组距为若组距为5,5,则则 组数组数 =全距全距 组距组距 =50=50 5=10(5=10(组组)若组距为若组距为10,10,则则 组数组数 =50=50 10=5(10=5(组组)本例采用组距为本例采用组距为10,10,组数为组数为5 5。(4 4)列表汇总计算)列表汇总计算 汇总计算要遵循汇总计算要遵循“不重不漏不重不漏”的原则。的原则。连续型变量数列相邻两组

36、的组限采用连续型变量数列相邻两组的组限采用“重限分组重限分组”的方法,的方法,即相邻两组之间的组限用同一个数值标记。为了处理好恰巧是组即相邻两组之间的组限用同一个数值标记。为了处理好恰巧是组限的变量值的总体单位的归属问题,应按限的变量值的总体单位的归属问题,应按“不含上限,含下限不含上限,含下限”的原则处理。例如,的原则处理。例如,6060分者应归入分者应归入60607070组中,组中,7070者应归入者应归入70708080组中,组中,8080分者应归入分者应归入80809090组中,组中,9090分者应归入分者应归入9090100100组组中。见表中。见表2-52-5所示。所示。表表2-5

37、 402-5 40名学生成绩整理表名学生成绩整理表成绩(分)成绩(分)划记法划记法人数(人)人数(人)505060602 2606070704 470708080正正正正111180809090正正正正正正18189090100100正正5 5合计合计40404040 将整理表编制成正式表,如表将整理表编制成正式表,如表2-62-6所示。所示。表表2-6 402-6 40名学生成绩统计表名学生成绩统计表 组中值是每组的中点数值,计算方法(上限组中值是每组的中点数值,计算方法(上限+下限)下限)2 2。如,如,(50+60)/2=55(50+60)/2=55、(60+70)/2=65(60+70

38、)/2=65、(70+80)/2=75(70+80)/2=75、(80+90)/2=85 80+90)/2=85、(90+100)/2=95(90+100)/2=95 等。等。成绩(分)成绩(分)不含上限不含上限 人数(人)人数(人)(频数)(频数)比重比重(%)(频)(频率)率)组距组距(分)(分)组中值组中值(分)(分)505060602 25.05.010105555606070704 411.011.01010656570708080111127.527.51010757580809090181845.045.01010858590901001005 512.512.510109595

39、合计合计4040100.0100.0 3.3.开口组变量分布数列的编制开口组变量分布数列的编制 若变量值中有特大或特小的极端值出现时,为避免出现空白若变量值中有特大或特小的极端值出现时,为避免出现空白组或个别极端值被遗漏,最小组和最大组可采用开口组办法解决,组或个别极端值被遗漏,最小组和最大组可采用开口组办法解决,即即“以下以下”、“以上以上”。并以相邻组组距作为其组距。并以相邻组组距作为其组距。例如,某班例如,某班4040名学生考试成绩如下:名学生考试成绩如下:36 56 60 36 56 60 6060 64 64 6464 6464 68 68 6868 6868 70 70 7070

40、75 75 7575 7575 7575 78 78 78 78 7878 7878 78 78 7878 79 79 7979 7979 7979 84 84 8484 85 85 8585 88 88 8888 89 89 8989 8989 8989 95 95 9595 98 100 98 100 编制等距变量数列如表编制等距变量数列如表2-72-7所示。所示。表表2-7 402-7 40名学生成绩统计表(开口式)名学生成绩统计表(开口式)两个开口组均用邻组组距,即均为两个开口组均用邻组组距,即均为1010。6060以下组组中值为:上限以下组组中值为:上限邻组组距邻组组距2=602=6

41、010102=552=55 90 90以上组组中值为:下限以上组组中值为:下限+邻组组距邻组组距2=90+102=90+102=95 2=95 成绩(分)成绩(分)不含上限不含上限 人数(人)人数(人)(频数)(频数)组距组距(分)(分)组中值组中值(分)(分)6060以下以下2 210105555606070708 81010656570708080161610107575808090901010101085859090以上以上4 410109595合计合计4040 本节小结本节小结:第三节第三节 统计数据的显示统计数据的显示 统计数据的显示方法有表格法与图示法两种形式。统计数据的显示方法有

42、表格法与图示法两种形式。一、统计表一、统计表 (一)统计表的意义(一)统计表的意义 将汇总得到的统计数据按一定顺序排列在表格中,这种表格将汇总得到的统计数据按一定顺序排列在表格中,这种表格称为统计表。称为统计表。(二)统计表的结构(二)统计表的结构 1.1.形式上:总标题、横行标题、纵栏标题、数字资料。形式上:总标题、横行标题、纵栏标题、数字资料。2.2.内容上:主词栏、宾词栏。内容上:主词栏、宾词栏。3.3.举例:见表举例:见表2-82-8、表、表2-92-9所示。所示。总标题总标题表表2-8 20032-8 2003年社会消费品零售总额年社会消费品零售总额 纵栏纵栏 标题标题 横行横行 数

43、字数字 标题标题 资料资料 主词主词 宾词宾词按所有制分组按所有制分组 企业数企业数(个)(个)零售额零售额(亿元)(亿元)国有经济国有经济891891197.41197.41集体经济集体经济11691169137.64137.64民营经济民营经济79379337.9237.92其它经济其它经济37543754743.17743.17合计合计660766071116.141116.14 总标题总标题表表2-9 2-9 全国税收收入及其构成表全国税收收入及其构成表 (20032003年)年)纵栏纵栏 标题标题 横横 指指 行行 标标 标标 数数 题题 值值 主词栏主词栏 宾词栏宾词栏按税种分组按

44、税种分组1 13 3累计税累计税收(亿元)收(亿元)同比增长同比增长(%)增值税与消费税收入增值税与消费税收入1019.821019.8216.416.4营业税收入营业税收入415.37415.379.59.5个人所得税收入个人所得税收入96.6596.6528.428.4关税收入关税收入130.99130.99144.4144.4其他其他536.74536.7417.617.6合计合计2199.572199.5719.519.5 (三)统计表的种类(三)统计表的种类 1.1.按作用按作用 调查表调查表 2.2.按主词按主词 简单表简单表 分分 类类 汇总表(整理表)汇总表(整理表)分分 类类

45、 分组表分组表 分析表分析表 复合表复合表 3.3.举例:举例:(1 1)简单表,主词未经分组,只排列空间顺序如表)简单表,主词未经分组,只排列空间顺序如表2-102-10所示。所示。表表2-10 2-10 某年某进出口公司商品收购计划完成情况(单位:万元)某年某进出口公司商品收购计划完成情况(单位:万元)单位名称单位名称 计划数计划数 实际数实际数 完成计划(完成计划(%)A A公司公司380380410410107.89107.89B B公司公司26026024024092.3192.31C C公司公司430430450450104.65104.65D D公司公司1001001201201

46、20.00120.00E E公司公司110110110110100.00100.00合合 计计1280128013301330103.91103.91 统计表的主词按时间顺序排列的简单表,如表统计表的主词按时间顺序排列的简单表,如表2-112-11所示。所示。表表2-11 2-11 某年某企业增加值统计表(单位:百万元)某年某企业增加值统计表(单位:百万元)时间时间增加值增加值一季度一季度178178二季度二季度162162三季度三季度184184四季度四季度202202合计合计726726 (2)(2)分组表:主词只按一个标志分组的统计表,见表分组表:主词只按一个标志分组的统计表,见表2-1

47、22-12所示。所示。表表2-12 2-12 某年全社会固定资产投资统计表某年全社会固定资产投资统计表按经济类型分组按经济类型分组投资额(亿元)投资额(亿元)同比增长(同比增长(%)国有经济投资国有经济投资15 66215 66219.619.6集体经济投资集体经济投资3 7173 717-3.5-3.5居民个人投资居民个人投资3 6383 6386.16.1其他类型投资其他类型投资5 4405 4409.19.1合合 计计28 45728 45714.114.1 (3)(3)复合表:主词按两个或两个以上标志分组的统计表,见表复合表:主词按两个或两个以上标志分组的统计表,见表2-132-13所

48、示。所示。表表2-13 2-13 某年某校在校生人数统计表某年某校在校生人数统计表按专业和性别分组按专业和性别分组学生人数(人)学生人数(人)合合 计计500500会会 计计 专专 业业100100男男7070女女3030计算机应用专业计算机应用专业250250男男180180女女7070电子商务专业电子商务专业150150男男120120女女3030 在复合分组表中设计横行标题时,应在第一次分组的各组组在复合分组表中设计横行标题时,应在第一次分组的各组组别下退一、二字填写第二次分组的组别,此时第一次分组的组别别下退一、二字填写第二次分组的组别,此时第一次分组的组别就成为第二次分组的个组小计。

49、若需再进行第三、四次分组,均就成为第二次分组的个组小计。若需再进行第三、四次分组,均可按此类推。再如表可按此类推。再如表2-142-14所示。所示。表表2-14 2-14 国内生产总值统计表国内生产总值统计表按产业和行业分组按产业和行业分组国内生产总值(亿元)国内生产总值(亿元)比重(比重(%)第一产业第一产业 第二产业第二产业 工业工业 建筑业建筑业 第三产业第三产业 交运仓储邮电通信业交运仓储邮电通信业 批发和零售贸易餐饮业批发和零售贸易餐饮业 合合 计计 3.3.宾词设计分类宾词设计分类 按排列形式分类:简单排列、分组排列、层叠排列。按排列形式分类:简单排列、分组排列、层叠排列。(1 1

50、简单排列)简单排列:宾词不加任何分组,按项目或时间排列。宾词不加任何分组,按项目或时间排列。如表如表2-152-15所示。所示。表表2-15 2-15 某地区工业企业主要经济指标统计表某地区工业企业主要经济指标统计表经济类型经济类型企业数企业数(个)(个)年均职工人数年均职工人数(人)(人)增加值增加值(万元)(万元)年末固定资产净值年末固定资产净值(万元)(万元)国有经济国有经济集体经济集体经济外商经济外商经济其他经济其他经济合合 计计 (2 2)平行排列:宾词各栏平行设计,如表)平行排列:宾词各栏平行设计,如表2-162-16、2-172-17所示。所示。表表2-16 2-16 各地社会

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公文档 > PPT模板素材

宁ICP备18001539号-1