统计学第二章.docx

上传人:scccc 文档编号:13450068 上传时间:2021-12-26 格式:DOCX 页数:5 大小:21.71KB
返回 下载 相关 举报
统计学第二章.docx_第1页
第1页 / 共5页
统计学第二章.docx_第2页
第2页 / 共5页
统计学第二章.docx_第3页
第3页 / 共5页
统计学第二章.docx_第4页
第4页 / 共5页
统计学第二章.docx_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《统计学第二章.docx》由会员分享,可在线阅读,更多相关《统计学第二章.docx(5页珍藏版)》请在三一文库上搜索。

1、第二章 统计数据的收集、整理与显示2.1 统计数据的收集一、统计数据的来源1 、直接来源(原始来源):分为实验和统计调查(直接观察、报告、采访、登记)2、间接来源(二手资料):出版物、网络二、统计调查组织方式1 、分类按调查单位的范围大小分:全面调查和非全面调查按调查时间是否连续分:经常性调查和一次性调查按调查组织方式分:统计报表和专门调查。其中专门调查又分为普查、重点调查、典型调查、抽样调查2、统计报表制度:按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度 优点:能保证统计资料的全面性和连续性;能保证统计资料的统一性和及时性;能满足各级部门对统计资料的

2、需要 缺点:统计报表过多会增加基层负担;有可能由于虚假瞒报而影响统计资料质量3、普查:是指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查(主要用于搜集时点资料) 作用:可以为抽样调查提供抽样框;可以收集统计报表所不能提供的反映重大国情国力的基本统计信息 局限:由于需要大量的人力、物力、财力,不宜经常进行4、重点调查:是指为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式。(这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况) 作用:能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料 局限:只适用于客观存在重点单位

3、的情况5、典型调查:是指在对调查对象有一定了解的基础上,有意识的选择少数典型单位进行调查的一种非全面调查方式。(指在数量表现上具有普遍意义呵呵代表性的总体单位,可以用来推断总体的数量)作用:一定条件下能估计总体指标数值;可以用来研究新生事物缺陷:不能确定推断的把握程度,无法计算和控制推断误差6、抽样调查:是指按照随机原则从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式。(是指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中的机会) 特点:按随机原则抽取样本单位,目的是推断总体的数量特征;抽样误差可以事先计算并控制

4、优点:能用较少的人力、物力和时间达到全面调查的的目的;调查资料的准确性较高、受人为干扰的可能性较小7、我国的统计调查体系以必要的周期性普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和少量全面报表的综合的统计调查方法体系三、统计调查方案1 、是指用来指导整个调查工作的纲领性文件,基本内容如下: 调查目的;(为什么调查)调查对象与调查单位;(向谁调查一填报单位) 调查项目与调查表;(调查什么)一标志调查时间;(调查时间、调查期限)制定调查工作的组织实施计划四、统计调查误差1、是指收集来的数据资料与真实情况间的差异2、研究调查误差的主要目的是找出导致误差产生的原因,进而采取对策避免

5、、减少误差或 控制误差水平3、种类 登记误差:由于人的主观故意或失误而产生的误差,理论上它可以用某种方法加以消除 代表性误差:由部分单位数值来推断总体数值所产生的误差,它不可以消除,但可以加 以控制 .2统计数据的整理一、统计数据整理的内容1、是指将统计调查得到的原始资料进行科学的分组和汇总,形成综合统计资料的工作过程2、地位:统计调查的继续;统计分析的前提和基础3、内容:统计数据的处理:审核、筛选、排序、分组、汇总及制度;统计数据的管理:数据的传输、贮存、更新及输出二、统计数据的分组1、统计分组:将总体所有单位按一定标志分为性质不同但又有联系的若干部分选择分组标志一确定分组体系一总体单位归类

6、2、总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变得条理化,便于进一步分析研究3、分组体系:同时使用两个、两个以上标志分组时,分组标志的组合形式例如:教师(平行分组体系)按性别分类:男性、女性(简单分组)按职称分类:高级、中级、初级(品质分组)按年龄分类:40以上、40以下(数量分组)例如:教师(复合分组体系)将不同分类信息里共同的部分叠合在一起三、频数分布数列的编制1、分布数列是指将总体各单位按某个标志分成若干组,列出各组的单位数或各组在总体中所占的比重而形成的数列构成要素:总体按某标志所分的组;各组的单位数(频数 |频率)2、单值数列每个组值只用一个具体的变量

7、值表现的数列编制条件:变量是离散变量;变量的不同取值个数较少例如:已知某车间有 24名工人,他们的日产量(件)分别是:20、23、20、24、23、21、22、25、26、20、21、21、22、22、23、22、22、24、25、21、22、21、24、23.要求根据 以上资料编制变量数列。编制结果如下:日rs (件)x 工人数(人)Y203215226234243252261合计243、组距数列是指每个组的变量值用一个区间来表现的变量数列编制条件:连续变量;或变量不同取值个数也较多的离散变量组限:每组两端表示各组界限的变量值,各组的最小值为下限,最大值为上限组距:每组变量值变动区间的长度组

8、中值:每组变量取值范围的中点数值。组中值=下限+组距+ 2例题1:某地区100个百货商店按月销售额的分成情况销售额(力兀)商店数(个)百分比()100以下1010100200202020030030303004002525400以上1515看销售额我们可以看出这个是连续组距式分组等距分组。以100200为例,100是下组限L, 200是上限U则组距 d=U-L=200-100=100组中值 x=L+d+ 2=100+100+2=150例题2:某企业100名职工按年龄分组情况年龄职工数(人)百分比()1824101025342020354930305059252560岁以上1515看年龄的划分我

9、们可以得出这个市间断组距式分组异距分组。以2534为例,25是下限L, 34不是上限,35才是上限U故而组距d=35-25=10组中值=25+10 + 2=30例题3:已知某地区某年 50个商店商品销售额的资料如下:(单位:百万)7.412.629.02.012.47.014.817.515.018.218.715.512.826.017.38.314.712.03.56.825.019.36.44.011.98.513.214.517.115.613.44.59.520.015.76.011.423.014.216.721.016.013.610.013.95.0 5.8 10.5 16.3

10、 22.0。要求编制组距数列。1)确定全距 R=Xmax Xmin=29 2=27 (百万元)2)确定组距及组数 RW组距(d) x组数(m)n=1+3.3logN d=R/n= (Xmax-Xmin) / (1+3.3logN)3)确定组限。组限的表达方法: 能够体现事物质的差别对于离散变量,相邻组组限可以间断,也可以重叠对于连续变量,相邻组组限一般重叠;此时要求符合“上组限不计入”原则首末两组可使用“ XXX以下”及“ XXX以上”的开口组4)计算次数和频数销售额(白力兀)组中彳1 ( X)商店数(f)频率()5以下2.5485107.51020101512.51632152017.513

11、26202522.54825以上27.536合计一50100其中频率是指各组单位在总体单位中的比重累计次数与累计频率向上累计从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累 计,说明某一组上限以下各组的累计次数(频数)向卜累“从变量值高的组开始,将各组次数(频数)逐次向变量值低的组累 计,说明某一组下限以上各组的累计次数(频数)例如:销售额(百 力兀)商店数频率() f/Ef累计次数累计频率向上向卜向上向卜5以下48450810051010201446289210151632303660721520132643208640202548477941425以上365031006合计501

12、00一一一一2.3统计数据的显示一、统计表1、以纵横交叉的线条所形成的表格来表现统计资料的形式(容量大、方便计算)统计表的基本结构(从表式上)总标题列标题行标题数据表外附加(资料来源,注)2、编制规则(简练、明确、实用、美观、便于比较)选择合适的标题统计表中要设置相应的计量单位表的上、下端用粗线或双线封口,左右两端一般不封口(开口式) 注意合计栏的位置(可在各列的文字标题下面设置编号加以标识)注意数据的对齐方式,且数据栏不能出现空白数据单元(0,,一)必要的注解及资料来源二、统计图1、以点、线、条、面积等方式描述、显示统计数据的形式(直观、醒目、易于理解)条形图:用于显示离散型变量的次数饼图:主要用于显示定类变量的次数分布雷达图:主要用于多个变量的比较直方图:用于显示连续型变量的次数分布 折线图:以线段的起伏表示总体数量分布的特征累计曲线分布图:以横线表示分组、纵轴表示累计频数(频率) 散点图:主要用来观察变量间的相关关系,也可显示数量随时间的变化情况2、数据中常见的错误使用花哨的图表 数据比较时没有可靠的相对基准压缩纵轴纵轴上无零点

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1