统原PP第七章抽样估计(上).ppt

资源描述

《统原PP第七章抽样估计(上).ppt》由会员分享，可在线阅读，更多相关《统原PP第七章抽样估计(上).ppt（15页珍藏版）》请在三一文库上搜索。

1、1,第七章抽样估计,科学有险阻苦战能过关陈毅,2,第七章抽样估计,笫一节抽样估计的意义和作用一、抽样估计的基本概念 1、全及总体和样本总体全及总体被调查研究的事物的全体，母体。样本总体从全及总体中随机抽取的部分，样本。总体单位总体单位数总体总量 N 有限无限特大样本单位样本单位数样本容量 n 有限大样本 n50 n30(精度不高，方差小)方法易社会经济统计小样本 n50 n30 (非正态，为t分布) 方法难自然技术统计从全及总体中，可抽一个样本，也可抽一系列样本，每个样本都可以计算各种指标。,3,2、全及指标和样本指标全及指标根据全及总体单位

2、计算的统计指标。 P 2常数未知样本指标根据抽样总体单位计算的统计指标。 P s s2变数计算 3、重置抽样和不重置抽样重置抽样被抽中单位仍放回总体参加下次抽取。不重置抽样被抽中单位不放回总体不参加下次抽取。 4、全部可能样本数不重置抽样考虑顺序不重复排列数重置抽样考虑顺序可重复排列数不重置抽样不考虑顺序不重复组合数重置抽样不考虑顺序可重复组合数 N n固定，则所有可能样本数固定考虑顺序所有可能样本数不考虑顺序所有可能样本数重置抽样所有可能样本数不重置抽样所有可能样本数,4,4、抽样误差统计误差登记性误差(登记或计算) (统计值与实际值之差)代表性误差系统

3、性误差(偏差违反随机原则) (非全面调查) 随机误差实际误差(某一样本) (不同样本带来) 平均误差(全部样本) 抽样平均误差(抽样误差)：由于抽样的随机性而产生的，样本指标与总体指标之间的平均误差，是所有可能出现的样本指标的标准差。 5、置信区间和置信概率置信区间：估计的总体指标所在的范围。置信概率：置信区间的可靠性大小。二、抽样估计的意义抽样估计按照随机原则，从全及总体中抽取部分单位组成样本，对样本进行调查并计算出各种统计指标，以此对全及指标所在范围进行概率估计的统计方法。,5,三、抽样估计的作用 1、用于无限总体或特大总体如环境污染、大气测量、含水率等。 2、用于破

4、坏性试验 3、用于其它特殊总体没必要或不可能全面调查的总体。 4、验证和修正全面调查的结果如人口普查。,6,第二节抽样估计的理论基础对概率论与数理统计知识的简单回顾。一、正态分布 1、密度函数数学期望决定正态分布曲线的位置标准差决定正态曲线的形状，当值变小时，中心分布升高，正态曲线趋于集中；当值变大时，中心分布降低，正态曲线趋于平缓。 2、标准正态分布 =0 =1的正态分布 t=1 =68.27% t=2 =95.45% t=3 =99.73% t=1.96 =95% t=2.58 =99% 3、标准化变量代换,7,二、样本的分布 1、样本的代表性分布越接近于总体的样

5、本代表性越强，然而有些接近，有些不接近。总希望接近总体的样本数量多一些，抽到它们的概率高一些。样本平均数是样本的代表值，研究它的分布规律是研究样本代表性问题的关践。总体的分布单位数N 分布未知均数标准差样本的分布单位数n 不太偏均数标准差s 样本均数分布单位数正态分布均数标准差 2、大数定理：只要n充分大，样本的分布一致于总体的分布，样本均数趋近于总体均数，样本标准差趋近于总体标准差。,8,3、中心极限定理,(1)若总体为正态分布，样本均数也服从正态分布。 (2)总体为任意分布(不太偏)，样本均数随着n的增大而趋近于正态分布。(n50) (3)样

6、本平均数的平均数等于总体平均数 = (4)样本平均数的标准差为：重置抽样不重置抽样,9,第三节总体平均数的抽样估计,一、总体均数估计的公式中心极限定理表明，只要n足够大(n50)，样本均数的分布就趋近于正态分布，作变量代换则z服从于标准正态分布：,10,二、区间估计的特点第一、抽样估计计算的是总体指标所在的范围称为置信区间。不等式表示：区间表示：定值表示：第二、置信区间表明的是一个可能范围，不是可靠范围，总体落在置信区间内的概率称为置信概率。用表示。第三、扩大置信区间可提高置信概率，缩小置信区间可降低置信概率，扩大或缩小的倍数称为概率度，用t表示。称为极限抽样误差，是

7、抽样误差的最大限度。例如：若概率度t=2 ，则极限误差为，置信区间为，置信概率为95.45%。,11,三、抽样误差的计算以上公式中，的计算是抽样估计的基础，称为抽样平均误差，简称抽样误差，用表示。理论上：数理统计证明，样本标准差 s 是总体标准差的偏误估计量，而是总体标准差的无偏估计量。当n1时，n-1n，，可用样本标准差 s 代替总体标准差计算。抽样误差的计算公式：重置抽样：不重置抽样：,12,四、大样本平均数抽样估计综述,重置抽样不重置抽样估计步骤： 1、据样本资料计算和s 2、根据置信概率确定t(正态分布表) 3、计算抽样误差(重置或不重置) 4、计算

8、极限抽样误差 5、计算置信区间 6、回答,13,大样本平均数抽样估计举例,对某灯泡厂随机抽取500个灯泡进行质量检验，结果如右表所示。求该厂全部灯泡平均耐用时间的取值范围(置信概率为.9973)。解：灯泡平均耐用时间样本标准差 99.73% t3 抽样误差极限抽样误差置信区间,14,课堂练习,某地居民1000人，其年收入抽样调查结果如右表所示。以95%的置信概率估计该地人口年均收入。解：人口年均收入样本标准差 95% t1.96 抽样误差极限抽样误差置信区间,15,课外作业,某地有小麦10000亩，抽样调查结果如右表所示。以95%的置信概率估计小麦亩产量所在范围。以68.27%的置信概率估计亩产量在300kg以上的播种面积数。,

展开阅读全文