谈统计与抽样调查的几个问题.ppt

上传人:本田雅阁 文档编号:3223513 上传时间:2019-08-02 格式:PPT 页数:44 大小:590.01KB
返回 下载 相关 举报
谈统计与抽样调查的几个问题.ppt_第1页
第1页 / 共44页
谈统计与抽样调查的几个问题.ppt_第2页
第2页 / 共44页
谈统计与抽样调查的几个问题.ppt_第3页
第3页 / 共44页
谈统计与抽样调查的几个问题.ppt_第4页
第4页 / 共44页
谈统计与抽样调查的几个问题.ppt_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《谈统计与抽样调查的几个问题.ppt》由会员分享,可在线阅读,更多相关《谈统计与抽样调查的几个问题.ppt(44页珍藏版)》请在三一文库上搜索。

1、谈统计与抽样调查的几个问题,交流 欢迎随时提问和讨论 国家统计局统计教育培训中心 张勇 010-63376217,13661037717 ,一、引言,戒烟是很容易的事,我就戒过一千次了。 -马克.吐温 做统计是很容易的事,我就做过成千上万次了。 -张勇 我们每个人都做统计成千上万次了。 问题是如何做好统计,反映宏观经济状况 四大重要经济指标:,经济发展:GDP 物价:CPI,PPI 就业:失业率vs就业率 国际收支:进出口额 问题?,统计与调查的关系,如何理解统计?statistics 统计资料与统计学 统计学:收集数据和分析数据 调查:收集数据和简单分析 统计工作?,数据挖掘与大数据,这是2

2、1世纪引人注意的概念 这是与统计相关的概念 存在的问题?,抽样调查是一种调查,调查的生命周期(阶段): 调查计划 设计和开发 操作与实施(包括发布) 调查评估,抽样调查的发展,历史 当前的理论与方法 实际中存在的主要问题 统计与说谎-国内外,对统计数字的看法,越多越好? 有好?无好? 谎言,糟糕透顶的谎言,统计数字,信仰不能取代数字,数据胜过自封的专家 数字不会说谎,但说谎的人会想出办法 用统计骗人很容易,但不用统计骗人更容易,要问的几个基本问题,谁说的? 他是如何知道的? 遗漏了什么? 是否有人偷换了概念? 这个资料有意义吗? 然后再去探讨具体的问题,简述,什么是抽样调查? 什么是统计学意义

3、上的抽样调查?概率抽样 抽样调查应用中的几个问题 抽样调查不神秘,我们的生活中经常用到抽样调查 抽样调查科技含量较高 正式的社会经济调查,国外用得好,大家提抽样方法中的问题,样本的代表性问题-抽样方法 数字准确的问题-样本量 敏感性问题 无回答(包括拒答) 满足分级管理需要 多目标抽样 样本轮换,调查的责任,原始数据是编造的假数据,一个统计人员却不知道或装不知道,在那里加班加点认真分析计算,又得到了一些数据。据此数据进行决策,结果如何? 反之,原始数据为真,却发布为假数据。据此数据进行分析和决策,结果又如何? (杯具),调查数据的真实,敢-中国的过去和现在,美国大选例子 能 理论科学才能做保证

4、 理论科学与实际工作之间的联系 Theory based on practice and serves for practice 提高统计能力和统计数据质量,二、对抽样调查的认识,加拿大提出的概念 调查就是使用明确的概念、方法和程序,以有组织、有条理的方式,从一个总体的部分或所有单元中搜集感兴趣的指标信息,并将这些信息综合编辑成有用的简要形式的所有活动。 抽样调查Survey 普查Census,(一)抽样调查分类,1. 非概率抽样 随意抽样 志愿者抽样 判断抽样 配额抽样 修正的概率抽样,2. 概率抽样(统计学中的抽样),简单随机抽样(SRS) 系统抽样(SYS) 与大小成比例的概率(PPS)

5、抽样 整群抽样 (CLU) 分层抽样(STR) 多阶抽样 多相抽样,为什么要有不同的组织方式或方法?,资源有限: 人 财 物 时间 资源消耗:普查概率抽样调查非概率抽样调查,(二)抽样调查的步骤,调查目标的系统陈述; 抽样框的选择; 抽样方法的确定; 问卷设计; 数据收集; 数据编码和录入; 审核与插补; 估计; 数据分析和调查结果的表述; 数据发布; 文档。,步骤全吗?,基本全了 可以增加吗? 公关,宣传 编制计算机处理程序,中国的统计调查方案,(一)调查的目的和任务 (二)调查对象、调查单位和报告单位 (三)调查项目和调查表 (四)调查的时间标准和空间标准 (五)组织计划,考虑普查和抽样调

6、查的几个重要因素,费用 时效 总体大小 小区域估计 属性的多少 调查误差 特殊要求-破坏性调查,资源限制等 其他因素-抽样框更新等,这几个因素重要吗?,在尊重科技的外国 ? 在中国 ? 在中国什么最重要? ?,普查与抽样调查之间的联系,普查是抽样调查的特例 抽样比是100% 抽样调查是特殊的普查 对样本总体的普查,(三)调查误差,抽样误差-可以根据概率分布计算 非抽样误差 -主要为三类:抽样框(总体)误差,无回答误差,计量误差。数据处理误差 普查和抽样调查的误差-哪个准? 对“准”的认识-从测量一张纸的长度说起-点估计和区间估计,实际调查中的误差,误差总是存在的。 实际误差是无法计算的,只能通

7、过样本估计。 非抽样误差 抽样误差 哪种误差大? 哪种误差可以控制?,调查数据的质量,过程质量控制和管理 事后数据评估(分析合理性) 这与产品质量控制和管理的原理完全相同!,评价估计量的标准,无偏性 一致性 有效性,抽样误差,极限误差 相对误差r 用到标准差,它由方差得到。 95 % 的置信度, z=1.96 样本量变异系数:0.025,0.05,0.075,样本代表性的问题,抽样调查不谈这个概念,为什么? 因为是根据概率分布抽取的,并根据概率分布进行推断。 抽样调查中强调精度,与什么有关? 样本量,三、样本量的确定,不是多多益善-美国大选 也不是总体越大,样本量也相应越大 对较小的总体,抽样

8、无太大优点 样本量是科学计算出来的,不是主观确定的!,(一)影响样本量的主要因素,1抽样推断的可靠程度(置信度) 2总体标志变异程度(方差) 3极限误差或相对误差的大小 4抽样方法与组织方式的不同 其他-经费,访员,时间,物资,回答率等,精度及其影响因素,1总体的变异程度 2总体大小(下表解释) 3样本设计和估计量 4调查的回答率 上面推断的可靠程度,就是置信度,一般人为取95% 极限误差或相对误差的大小是人为确定的 这里不考虑其他因素,确定样本量后,要根据其他因素的限制,适当调整置信度或控制误差,用简单随机抽样估计比例P,在置信度为95%、 误差限为0.05时所需要的样本量(P=0.5),加

9、拿大的结果,四、中国抽样调查中常用的抽样方法,对称等距抽样 PPS系统抽样 MPPS系统抽样 区分等距抽样与系统抽样,五、抽样框的问题,有几种抽样框? 名录框 地域框-农作物调查 概念框 多样框,六、抽样调查实际中的问题,敏感性问题 无回答(包括拒答) 满足分级管理需要 多目标抽样 样本轮换,敏感性问题,重视问卷设计 加强问卷设计的力量 加强调查实施的技巧 采用科学推断方法 对无法得到的数据或准确数据 就不要调查,无回答(包括拒答),与敏感性问题有相似性 对问卷的要求很高 如果问卷设计无偏,则可根据回答率进行调整。 否则,美国Motel调查中使用的一种解决方法,可供参考。,调查满足多层次需要的问题,增加管理环节 增加样本量 增加投入 结果有待评估 一个现象:村村抽样,多目标调查问题,MPPS抽样 简单随机抽样 地域框抽样 多样框抽样,样本轮换问题,国际上使用的方法 我国使用的方法 折衷,七、保证抽样调查数据质量,科学的抽样调查设计(专业人员为主) 科学的实施(综合协作) 全过程质量控制和管理 谢谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1