第2章 统计资料的搜集与整理.ppt

上传人:时光煮雨 文档编号:21680972 上传时间:2023-10-13 格式:PPT 页数:44 大小:588.50KB
返回 下载 相关 举报
第2章 统计资料的搜集与整理.ppt_第1页
第1页 / 共44页
第2章 统计资料的搜集与整理.ppt_第2页
第2页 / 共44页
第2章 统计资料的搜集与整理.ppt_第3页
第3页 / 共44页
第2章 统计资料的搜集与整理.ppt_第4页
第4页 / 共44页
第2章 统计资料的搜集与整理.ppt_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《第2章 统计资料的搜集与整理.ppt》由会员分享,可在线阅读,更多相关《第2章 统计资料的搜集与整理.ppt(44页珍藏版)》请在三一文库上搜索。

1、第二章第二章 统计资料的搜集与整理统计资料的搜集与整理一、统计资料的搜集一、统计资料的搜集 初初级资料的搜集 初级资料的来源渠道:专门调查;科学实验 1、统计资料搜集方案的设计 调查目的 调查对象和调查单位 调查项目和调查表 调查方式、方法和调查时间 调查组织实施方案内容 单一表示例 读者调查表 亲爱的读者,非常感谢您对的支持,为帮助我们把杂志办得更好,请如实填写以下项目:1.您的姓名:性别:年龄:身份证号码:2.您的有效联系方式 通讯地址:邮编:电话:电子邮件:3.您的职业:4.您的教育程度:高中及以下 技校/中专 大专 本科 硕士 博士及以上 5.您的平均月收入:500元以下 500-80

2、0元 800-1000元 1000-15元 1500元以上 地址:省 市路138号杂志社发行部 邮编:030006 一览表示例 第四次全国人口普查表 本户住址:县(市)乡(镇、街道)普查区 普查小区(街巷 号)每个人都填报五岁即五岁以上人填报六岁及六岁以上人填报姓名与户主关系性别年龄民族户口状况和性质1985年7月1日常住地状况迁来本地原因文化程度申报人:普查员:填报日期:月 日 户主姓名:邮编:030006 2、统计资料搜集的组织方式 普查概念 普查组织方式 普查遵循的原则 普查普查普查机构直接登记登记单位填报规定统一的标准时点统一规定普查的项目和指标规定统一的普查期限普查应进行试点,总结经

3、验 典型调查典型调查就是从调查对象中选择具有代表就是从调查对象中选择具有代表性的单位作为典型,并通过对典型的调查来认性的单位作为典型,并通过对典型的调查来认识同类社会现象的本质和发展规律方法。识同类社会现象的本质和发展规律方法。重点调查重点调查是指对某种社会现象比较集中的、是指对某种社会现象比较集中的、对全局具有决定性作用的一个或几个单位所进对全局具有决定性作用的一个或几个单位所进行的调查。行的调查。典型调查与重点调查典型调查与重点调查 区别:区别:选择对象的标准不同选择对象的标准不同典型调查选典型,强典型调查选典型,强调样本质的方面的优势,重点调查选择集中性调样本质的方面的优势,重点调查选择

4、集中性的单位作为调查对象,强调样本在量的方面占的单位作为调查对象,强调样本在量的方面占优势;优势;调查的主要目的不同调查的主要目的不同典型调查目的是认识典型调查目的是认识事物的本质和规律,重点调查多可以进行定量事物的本质和规律,重点调查多可以进行定量调查。调查。典型调查与重点调查典型调查与重点调查 抽样调查是现代推断统计的核心,是现代统计方法抽样调查是现代推断统计的核心,是现代统计方法 中最为科学的统计调查方法。中最为科学的统计调查方法。抽样调查的概念抽样调查的概念 抽样调查的显著特点抽样调查的显著特点 抽样调查适用范围抽样调查适用范围抽样调查抽样调查它按照随机原则从总体中抽取样本单位 抽样调

5、查通过科学推断达到目的抽样调查的误差可以事先计算并加以控制某些不可能进行全面调查的情况虽然可能取得全面资料,但不必进行全面调查的情况对全面调查的资料进行验证和修正抽样调查抽样调查抽样调查组织方式简单随机抽样类型抽样等距抽样整群抽样多阶段抽样样本数在各类型中的分配等额分配等比例分配最优分配类型抽样:就是将类型抽样:就是将总体单位按其属性总体单位按其属性特征分成若干类型特征分成若干类型或层,然后在类型或层,然后在类型或层中随机抽取样或层中随机抽取样本单位。本单位。3、统计资料的搜集方法、统计资料的搜集方法 直接观察法直接观察法 采访法采访法 报告法报告法 问卷调查法问卷调查法 卫星遥感法卫星遥感法

6、 二、统计资料的整理(一)、统(一)、统计资料整理步骤1)设计统计资料整理方案 2)对搜集到的原始资料进行审查 3)资料汇总 5)对统计资料的系统积累 4)编制统计表 (二)、统计(二)、统计分组 统计统计分组含义 统计统计分组作用揭示现象总体内部的构成状况划分现象类型分析现象间的相互依存关系 分组揭示现象总体内部的构成状况举例按产业按产业分组分组198519851995199520052005绝对额(亿元)绝对额(亿元)比率(比率(%)绝对额(亿元)绝对额(亿元)比率(比率(%)绝对额(亿元)绝对额(亿元)比率(比率(%)第一产第一产 业业2542254228.328.31199320.62

7、0.6227182271812.512.5第二产第二产 业业3867386743.143.1281732817348.448.4862088620847.347.3第三产第三产 业业2566256628.628.618094180943131733957339540.240.2 合计合计897589751001005826058260100100182321182321100100我国国内生产总值内部构成情况注:注:2005年中国年中国GDP世界排名第四位(仅次于美国、日本、德国),人均世界排名第四位(仅次于美国、日本、德国),人均GDP排名第排名第112位位 划分现象类型举例经常项目经常项目

8、差额差额贷贷 方方借借 方方160,818,311160,818,311903,581,787903,581,787742,763,476742,763,476 A.A.货物和服务货物和服务124,797,704124,797,704836,887,831836,887,831712,090,128712,090,128 a.a.货物货物134,189,095134,189,095762,483,733762,483,733628,294,638628,294,638 b.b.服务服务-9,391,392-9,391,39274,404,09874,404,09883,795,49083,79

9、5,490 B.B.收益收益10,635,13910,635,13938,959,10038,959,10028,323,96128,323,961 1.1.职工报酬职工报酬1,519,6481,519,6483,337,0623,337,0621,817,4141,817,414 2.2.投资收益投资收益9,115,4919,115,49135,622,03835,622,03826,506,54726,506,547 C.C.经常转移经常转移25,385,46825,385,46827,734,85627,734,8562,349,3872,349,387 1.1.各级政府各级政府-176

10、,234-176,23448,84848,848225,082225,082 2.2.其它部门其它部门25,561,70225,561,70227,686,00827,686,0082,124,3052,124,3052005年中国经常项目下对外交往情况分析现象间的相互关系按文化程度分组总生育率(%)文盲2.93小学2.49初中2.07高中1.52中专1.37大学专科1.35大学本科1.12 育龄妇女生育状况资料来源:中国统计年鉴(1992年)统统计分组原则和方法 1)统统计分组原则 组内同质性和组间差异性原则 穷举性原则 “互斥”性原则2)分分组标志选择 根据研究问题的目的来选择分组标志 选

11、择最能反映研究对象本质特征的标志作为 分组标志 要结合现象所处的具体历史条件或经济条件 来选择分组标志3)分分组标志种类 按品质标志进行分组,也就是按照反映事物质 量属性的特征来分组 按数量标志分组,也就是按照反映事物数量差 异的数量标志作为分组标志进行分组。可为:单项式分组 组距式分组 单项式分组单项式分组:每一组的组别或者说每个组的名称只用一个变量值来表示按拥有发电机组数分组按拥有发电机组数分组发电厂家(家)发电厂家(家)1 12 22 25 53 310104 48 85 56 66 64 4合计合计3535某电业局所属电厂分组资料某电业局所属电厂分组资料组距式分组组距式分组:每一个组的

12、组别或者说是组的名称用一定变动范围的两个变量值来表示 某超市所属各连锁店分组资料按职工人数分组(人)按职工人数分组(人)商店数(个)商店数(个)100-300100-3008 8300-500300-5001414500-700500-7001616700-900700-9007 7900-1000900-10005 51000-12001000-12003 3合计合计53534)统统计分组方法 在进行统计分组时,按采用的分组标志得多少,可分为简单分组与复杂分组 简单简单分组:将被研究对象总体按一个标志进行分组 复杂复杂分组:将被研究对象总体按两个或两个以上的标 志进行分组,如人口按城乡和性别

13、分组 按城乡分组 按性别分组 城镇人口 农村人口男女男女作业:有20个工人看管机器台数及工人性别如下,试对其统计简单和复杂分组 5(男)4(女)2(男)4(女)3(女)4(女)3(男)4(女)4(男)2(女)4(女)3(男)4(男)3(女)2(男)6(女)4(男)4(男)2(女)1(男)分分布数列的概念和种类布数列的概念和种类 次数分数次数分数将总体中所有总体单位按一定的标志分成将总体中所有总体单位按一定的标志分成 若干组,列出各组总体单位数,形成总体单若干组,列出各组总体单位数,形成总体单 位在各组之间的分布排列位在各组之间的分布排列 频数(次数)频数(次数)分布在各组的总体单位数分布在各组

14、的总体单位数 频率(比率)频率(比率)各组的频数与总体频数各组的频数与总体频数 (总体单位数)之比(总体单位数)之比 分布数列(次数分布数列)分布数列(次数分布数列)将各组的频数或频率按照将各组的频数或频率按照 一定的顺序排列而成的数列一定的顺序排列而成的数列(三)(三)分布分布数列数列 分布数列又称分布数列又称“次数分配次数分配”。它根据一定标志对总体。它根据一定标志对总体进行分组,将各组按一定顺序排列,同时列出分在各进行分组,将各组按一定顺序排列,同时列出分在各组的单位数,用以反映总体单位在各组间的分配或分组的单位数,用以反映总体单位在各组间的分配或分布,分布在各组的总体单位数称次数,又称

15、频数。各布,分布在各组的总体单位数称次数,又称频数。各组次数与总次数之比称频率,也称比率。组次数与总次数之比称频率,也称比率。分布数列分布数列品质分布数列品质分布数列变量分布数列变量分布数列单项数列单项数列组距数列组距数列等距数列等距数列异距数列异距数列 品质分布数列举例品质分布数列举例按三次产业分按三次产业分组组就业人数(万人)就业人数(万人)比率(比率(%)第一产业第一产业352693526946.946.9第二产业第二产业169201692022.522.5第三产业第三产业230112301130.630.6合计合计75200752001001002004年中国各产业就业状况资料来源:中

16、国统计年鉴2005注:品质分布数列由两个要素构成:各组名称;各组频数或频率注:品质分布数列由两个要素构成:各组名称;各组频数或频率 变量分布数列举例变量分布数列举例栽树棵数(棵)栽树棵数(棵)职工人数(人)职工人数(人)比率(比率(%)25256 64 4262621211414272742422828282845453030292924241616303012128 8合计合计150150100100某单位职工日栽树棵数表注:变量分布数列有两个要素构成:各组变量值;各组频数或频率注:变量分布数列有两个要素构成:各组变量值;各组频数或频率 变变量量分布数列的种类及编制分布数列的种类及编制 1)

17、组距数列组距数列 按年龄分组按年龄分组人数(万人次)人数(万人次)比率(比率(%)1414岁及以下岁及以下64.1564.153.83.815152424131.97131.977.87.825254444828.82828.8248.948.945456464588.27588.2734.734.76565岁及以上岁及以上80.0580.054.84.8合计合计1693.261693.261001002004年入境旅游人数有有关组距数列的一些概念:关组距数列的一些概念:组限组限 组距组距 全距全距 组中值组中值 闭口数列和开口数列闭口数列和开口数列 变变量分布数列的种类及编制量分布数列的种类

18、及编制 1)组距数列组距数列成绩(分)成绩(分)学生人数(人)学生人数(人)比率(比率(%)50-6050-602 25 560-7060-708 8202070-8070-801818454580-9080-909 922.522.590-10090-1003 37.57.5合计合计4040100100某班数学考试成绩表组限组限:各组两端的数值:各组两端的数值 组距组距:各组上下限之间的距离:各组上下限之间的距离全距(全距(R):变量数列中最大与最小变量值之差:变量数列中最大与最小变量值之差组中值组中值:各组上下限的中点值:各组上下限的中点值 即组中值即组中值=(本组上限(本组上限+本组下限

19、)本组下限)/2闭口数列闭口数列:首末两组的上下限齐全的数列:首末两组的上下限齐全的数列开口数列开口数列:首组缺下限或末组缺上限的数列:首组缺下限或末组缺上限的数列 注注:开口组组距以相邻的组距近似替代:开口组组距以相邻的组距近似替代 下开口组组中值下开口组组中值=本组上限本组上限-邻组组距邻组组距/2 上开口组的组中值上开口组的组中值=本组下限本组下限+邻组组距邻组组距/22)组距数列的编制组距数列的编制 在编制组距数列的过程中,应根据统计研究的目的在编制组距数列的过程中,应根据统计研究的目的和现象的特征来确定是做等距分组编制等距数列,还和现象的特征来确定是做等距分组编制等距数列,还是做异距

20、分组编制异距数列是做异距分组编制异距数列 编编制等距数列:如果现象的质变的量变表现比较均匀制等距数列:如果现象的质变的量变表现比较均匀且分组的目的是为了直接比较各组次数或分析对比各且分组的目的是为了直接比较各组次数或分析对比各组指标组指标 编编制异距数列:如果现象的质变的量变表现不均匀且制异距数列:如果现象的质变的量变表现不均匀且分组的目的在于从数量上区分性质不同的总体,或者分组的目的在于从数量上区分性质不同的总体,或者有某一特定目的要求有某一特定目的要求等距数列编制举例等距数列编制举例 例:某工厂某月例:某工厂某月50名工人生产产品数量如下:名工人生产产品数量如下:80 88 113 96

21、103 104 97 75 88 72 87 93 94 99 109 77 87 100 92 106 78 101 95 87 92 103 96 92 78 76 82 102 117 93 89 111 90 110 115 105 107 84 90 98 94 85 109 118 94 112 第一步第一步:整理数据资料,确定全距:整理数据资料,确定全距 72 75 76 77 78 78 80 82 84 85 87 87 87 88 88 89 90 90 92 92 92 93 93 94 94 94 95 96 96 97 98 99 100 101 102 103 10

22、3 104 105 106 107 109 109 110 111 112 113 115 117 118 最大值为最大值为118,最小值为,最小值为72 全距全距=118-72=46件件第二步第二步:确定组数和组距:确定组数和组距 工人劳动效率可以分为低、较低、中等、较高、高工人劳动效率可以分为低、较低、中等、较高、高5个类型,即确定分为个类型,即确定分为5组。组距组。组距=全距全距/组数组数=46/5=9.2,为了计算方便,组距宜取为了计算方便,组距宜取5或或10的倍数,因此组距为的倍数,因此组距为10第三步第三步:确定组限:确定组限 确定组限应注意:确定组限应注意:组限的确定应当有利于表

23、现各变量值的实际分布组限的确定应当有利于表现各变量值的实际分布 确定的组显示事物性质的数量界限确定的组显示事物性质的数量界限 第一组下限应等于或小于最小变量值,但不宜过第一组下限应等于或小于最小变量值,但不宜过 小;最末一组的上限,应等于或大于最大变量小;最末一组的上限,应等于或大于最大变量 值,但不宜过大值,但不宜过大 为方便计算,组限尽可能取整数,最好是为方便计算,组限尽可能取整数,最好是5或或10倍倍 数数 组限的确定因变量有连续和离散之分而不同组限的确定因变量有连续和离散之分而不同 本例按产品件数确定为本例按产品件数确定为70-79、80-89、90-99、100-109、110-11

24、9第四步第四步:汇总数据,编制变量数列:汇总数据,编制变量数列按产品件数分组按产品件数分组职工人数(人)职工人数(人)频率(频率(%)70-7970-796 6121280-8980-891010202090-9990-9916163232100-109100-10911112222110-119110-1197 71414合计合计5050100100某厂50名工人某月生产产品件数分组表注注:等距分组可以直接比较各组对应的次数:等距分组可以直接比较各组对应的次数 异组分组不可以直接比较各组对应的次数,需要计算频异组分组不可以直接比较各组对应的次数,需要计算频 数密度即频数密度数密度即频数密度=

25、频数频数/组距组距3)分配数列表示法分配数列表示法 (1)累计次数分布)累计次数分布按产品件数分组按产品件数分组职工人数(人)职工人数(人)频率(频率(%)向上累计向上累计向下累计向下累计频数频数频率频率(%)(%)频数频数频率(频率(%)70-7970-796 612126 61212505010010080-8980-8910102020161632324444888890-9990-99161632323232646434346868100-109100-109111122224343868618183636110-119110-1197 7141450501001007 71414合计

26、合计5050100100累计频数分布表(2)分配数列图分配数列图 直方图直方图月生产件数频数(人)某工厂工人某月生产产品数折线图折线图折线图(3)分配数列主要类型(曲线图)分配数列主要类型(曲线图)正态分布左偏分布右偏分布钟形分布U形分布正J形分布反J形分布(四)、(四)、统计统计图表图表 统计表意义 统计表构成 统计表的分类统计表统计表统计表的构成统计表的构成按文化程度分组总生育率(%)文盲2.93小学2.49初中2.07高中1.52中专1.37大学专科1.35大学本科1.12 育龄妇女生育状况资料来源:中国统计年鉴(1992年)总标题总标题纵栏标题纵栏标题横行标题横行标题指标数值指标数值(

27、四)、(四)、统计统计图表图表 统计图统计图 1)线图)线图我国财政收支状况 2)条形图条形图我国财政收支状况3)圆形图(饼图)圆形图(饼图)4)环形图)环形图2000、2004年我国财政按功能性质分类支出年我国财政按功能性质分类支出作业:作业:某篮球集训队有某篮球集训队有40名篮球运动员,身高如下(单名篮球运动员,身高如下(单位:位:cm)197 188 193 215 199 198 192 196 187 218 205 210 201 217 202 196 195 214 204 208 203 197 207 194 204 209 202 212 206 203 192 202 201 206 197 200 205 199 205 200根据上述资料,试编制分布数列根据上述资料,试编制分布数列

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1