统原PP第七章抽样估计(上).ppt

上传人:本田雅阁 文档编号:2159220 上传时间:2019-02-23 格式:PPT 页数:15 大小:258.51KB
返回 下载 相关 举报
统原PP第七章抽样估计(上).ppt_第1页
第1页 / 共15页
统原PP第七章抽样估计(上).ppt_第2页
第2页 / 共15页
统原PP第七章抽样估计(上).ppt_第3页
第3页 / 共15页
亲,该文档总共15页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《统原PP第七章抽样估计(上).ppt》由会员分享,可在线阅读,更多相关《统原PP第七章抽样估计(上).ppt(15页珍藏版)》请在三一文库上搜索。

1、1,第七章 抽样估计,科学有险阻 苦战能过关 陈 毅,2,第七章 抽样估计,笫一节 抽样估计的意义和作用 一、抽样估计的基本概念 1、全及总体和样本总体 全及总体 被调查研究的事物的全体,母体。 样本总体 从全及总体中随机抽取的部分,样本。 总体单位 总体单位数 总体总量 N 有限 无限 特大 样本单位 样本单位数 样本容量 n 有限 大样本 n50 n30(精度不高,方差小)方法易 社会经济统计 小样本 n50 n30 (非正态,为t分布) 方法难 自然技术统计 从全及总体中,可抽一个样本,也可抽一系列样本,每个样本都可以计算各种指标。,3,2、全及指标和样本指标 全及指标 根据全及总体单位

2、计算的统计指标。 P 2常数未知 样本指标 根据抽样总体单位计算的统计指标。 P s s2变数计算 3、重置抽样和不重置抽样 重置抽样 被抽中单位仍放回总体参加下次抽取。 不重置抽样 被抽中单位不放回总体不参加下次抽取。 4、全部可能样本数 不重置抽样考虑顺序 不重复排列数 重置抽样考虑顺序 可重复排列数 不重置抽样不考虑顺序 不重复组合数 重置抽样不考虑顺序 可重复组合数 N n固定,则所有可能样本数固定 考虑顺序所有可能样本数不考虑顺序所有可能样本数 重置抽样所有可能样本数不重置抽样所有可能样本数,4,4、抽样误差 统计误差 登记性误差(登记或计算) (统计值与实际值之差)代表性误差 系统

3、性误差(偏差 违反随机原则) (非全面调查) 随机误差 实际误差(某一样本) (不同样本带来) 平均误差(全部样本) 抽样平均误差(抽样误差):由于抽样的随机性而产生的,样本指标与总体指标之间的平均误差,是所有可能 出现的样本指标的标准差。 5、置信区间和置信概率 置信区间:估计的总体指标所在的范围。 置信概率:置信区间的可靠性大小。 二、抽样估计的意义 抽样估计按照随机原则,从全及总体中抽取部分单位组成样本,对样本进行调查并计算出各种统计指标,以此对全及指标所在范围进行概率估计的统计方法。,5,三、抽样估计的作用 1、用于无限总体或特大总体 如环境污染 、大气测量 、 含水率等。 2、用于破

4、坏性试验 3、用于其它特殊总体 没必要或不可能全面调查的总体。 4、验证和修正全面调查的结果 如人口普查。,6,第二节 抽样估计的理论基础 对概率论与数理统计知识的简单回顾。 一、正态分布 1、密度函数 数学期望 决定正态分布曲线的位置 标准差 决定正态曲线的形状, 当值变小时,中心分布升高,正态曲线趋于集中; 当值变大时,中心分布降低,正态曲线趋于平缓。 2、标准正态分布 =0 =1的正态分布 t=1 =68.27% t=2 =95.45% t=3 =99.73% t=1.96 =95% t=2.58 =99% 3、标准化 变量代换,7,二、样本的分布 1、样本的代表性 分布越接近于总体的样

5、本代表性越强,然而有些接近,有些不接近。 总希望接近总体的样本数量多一些,抽到它们的概率高一些。 样本平均数是样本的代表值,研究它的分布规律是研究样本代表性问题的关践。 总 体 的 分 布 单位数N 分布未知 均数 标准差 样 本 的 分 布 单位数n 不太偏 均数 标准差s 样本均数分布 单位数 正态分布 均数 标准差 2、大数定理:只要n充分大,样本的分布一致于总体的分布,样本均数趋近于总体均数,样本标准差趋近于总体标准差。,8,3、中心极限定理,(1)若总体为正态分布,样本均数 也服从正态分布。 (2)总体为任意分布(不太偏),样本均数 随着n的增大而趋近于正态分布。(n50) (3)样

6、本平均数的平均数等于总体平均数 = (4)样本平均数的标准差为: 重置抽样 不重置抽样,9,第三节 总体平均数的抽样估计,一、总体均数估计的公式 中心极限定理表明,只要n足够大(n50),样本均数的分布就趋近于正态分布 ,作变量代换 则z服从于标准正态分布:,10,二、区间估计的特点 第一、抽样估计计算的是总体指标所在的范围称为置信区间。 不等式表示: 区间表示: 定值表示: 第二、置信区间表明的是一个可能范围,不是可靠范围,总体落在置信区间内的概率称为置信概率。用表示。 第三、扩大置信区间可提高置信概率,缩小置信区间可降低置信概率,扩大或缩小的倍数称为概率度,用t表示。 称为极限抽样误差,是

7、抽样误差的最大限度。 例如:若概率度t=2 ,则极限误差为 ,置信区间为 ,置信概率为95.45%。,11,三、抽样误差的计算 以上公式中, 的计算是抽样估计的基础,称为抽样平均误差,简称抽样误差,用 表示。理论上: 数理统计证明,样本标准差 s 是总体标准差 的偏误估 计量,而 是总体标准差的无偏估计量。 当n1时,n-1n, ,可用样本标准差 s 代替总体标准差计算。 抽样误差的计算公式: 重置抽样: 不重置抽样:,12,四、大样本平均数抽样估计综述,重置抽样 不重置抽样 估计步骤: 1、据样本资料计算 和s 2、根据置信概率确定t(正态分布表) 3、计算抽样误差(重置或不重置) 4、计算

8、极限抽样误差 5、计算置信区间 6、回答,13,大样本平均数抽样估计举例,对某灯泡厂随机抽取500个灯泡 进行质量检验,结果如右表所示。 求该厂全部灯泡平均耐用时间的 取值范围(置信概率为.9973)。 解:灯泡平均耐用时间 样本标准差 99.73% t3 抽样误差 极限抽样误差 置信区间,14,课堂练习,某地居民1000人,其年收入抽样调查 结果如右表所示。 以95%的置信概率估计该地人口年均收入。 解:人口年均收入 样本标准差 95% t1.96 抽样误差 极限抽样误差 置信区间,15,课外作业,某地有小麦10000亩,抽样调查 结果如右表所示。 以95%的置信概率估计小麦 亩产量所在范围。 以68.27%的置信概率估计 亩产量在300kg以上的播种面积数。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1