06第6章抽样与抽样分布ppt课件.ppt

上传人:scccc 文档编号:13501184 上传时间:2022-01-10 格式:PPT 页数:64 大小:2.86MB
返回 下载 相关 举报
06第6章抽样与抽样分布ppt课件.ppt_第1页
第1页 / 共64页
06第6章抽样与抽样分布ppt课件.ppt_第2页
第2页 / 共64页
06第6章抽样与抽样分布ppt课件.ppt_第3页
第3页 / 共64页
06第6章抽样与抽样分布ppt课件.ppt_第4页
第4页 / 共64页
06第6章抽样与抽样分布ppt课件.ppt_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《06第6章抽样与抽样分布ppt课件.ppt》由会员分享,可在线阅读,更多相关《06第6章抽样与抽样分布ppt课件.ppt(64页珍藏版)》请在三一文库上搜索。

1、第 6 章 抽样与抽样分布,6.1 概率抽样方法6.2 三种不同性质的分布 6.3 一个总体参数推断时样本统计量分布6.4 两个总体参数推断时样本统计量分布,学习目标,了解抽样的概率抽样方法区分总体分布、样本分布、抽样分布理解抽样分布与总体分布的关系掌握单总体参数推断时样本统计量的分布掌握双总体参数推断时样本统计量的分布,6.1 概率抽样方法,6.1.1 简单随机抽样6.1.2 分层抽样6.1.3 系统抽样6.1.4 整群抽样,抽样方法,概率抽样(probability sampling),根据一个已知的概率来抽取样本单位,也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有

2、一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的 当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率,简单随机抽样(simple random sampling),从总体N个单位中随机地抽取n个单位作为样本,使得每一个容量为样本都有相同的机会(概率)被抽中 抽取元素的具体方法有重复抽样和不重复抽样特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率,分层抽样(stratified sampling),将总体单位按某种特征或某种

3、规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计,系统抽样(systematic sampling),将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k等单位优点:操作简便,可提高估计的精度缺陷:对估计量方差的估计比较困难,整群抽样(cluster sampling),将总体中若干个单位合并为组(群),抽样

4、时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差,多阶段抽样(multi-stage sampling),先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查群是初级抽样单位,第二阶段抽取的是最终抽样单位。将该方法推广,使抽样的段数增多,就称为多阶段抽样具有整群抽样的优点,保证样本相对集中,节约调查费用需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开在大规模的抽样调查中,经常被采用的方法,非概率抽样(non

5、-probability sampling),相对于概率抽样而言抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式,方便抽样,调查过程中由调查员依据方便的原则,自行确定入抽样本的单位调查员在街头、公园、商店等公共场所进行拦截调查厂家在出售产品柜台前对路过顾客进行的调查优点:容易实施,调查的成本低缺陷:样本单位的确定带有随意性,样本无法代表有明确定义的总体,调查结果不宜推断总体,判断抽样,研究人员根据经验、判断和对研究对象的了解,有目的选择一些单位作为样本有重点抽样,典型抽样,代表抽样等

6、方式判断抽样是主观的,样本选择的好坏取决于调研者的判断、阅历、专业程度和创造性抽样成本比较低,容易操作样本是人为确定的,没有依据随机的原则,调查结果不能用于对推断总体,自愿样本,被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息例如,参与报刊上和互联网上刊登的调查问卷活动,向某类节目拨打热线电话等,都属于自愿样本自愿样本与抽样的随机性无关样本是有偏的不能依据样本的信息推断总体,滚雪球抽样,先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。这个过程持续下去,就会形成滚雪球效应适合于对稀少群体和特定群体研究优点:容

7、易找到那些属于特定群体的被调查者,调查的成本也比较低,配额抽样,先将体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位操作简单,可以保证总体中不同类别的单位都能包括在所抽的样本之中,使得样本的结构和总体的结构类似抽取具体样本单位时,不是依据随机原则,属于非概率抽样,概率抽样与非概率抽样的比较,概率抽样依据随机原则抽选样本样本统计量的理论分布存在可根据调查的结果推断总体非概率抽样不是依据随机原则抽选样本样本统计量的分布是不确定的无法使用样本的结果推断总体,6.2 三种不同性质的分布,6.2.1 总体分布6.2.2 样本分布6.2.3 抽样分布,总

8、体中各元素的观察值所形成的分布 分布通常是未知的可以假定它服从某种分布,总体分布(population distribution),一个样本中各观察值的分布 也称经验分布 当样本容量n逐渐增大时,样本分布逐渐接近总体的分布,样本分布(sample distribution),样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布 随机变量是 样本统计量样本均值, 样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据,抽样分布 (sampling distribu

9、tion),抽样分布的形成过程 (sampling distribution),6.3 样本统计量的抽样分布 (一个总体参数推断时),6.3.1 样本均值的抽样分布6.3.2 样本比例的抽样分布6.3.3 抽样方差的抽样分布,样本均值的抽样分布,在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布一种理论概率分布推断总体均值的理论基础,样本均值的抽样分布,样本均值的抽样分布(例题分析),【例】设一个总体,含有4个元素(个体) ,即总体单位数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总体的均值、方差及分布如下,均值和方差,样本均值的抽样分布 (例题分析)

10、, 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为,样本均值的抽样分布 (例题分析), 计算出各样本的均值,如下表。并给出样本均值的抽样分布,样本均值的分布与总体分布的比较 (例题分析), = 2.5 2 =1.25,总体分布,样本均值的抽样分布与中心极限定理,当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x 的数学期望为,方差为2/n。即xN(,2/n),中心极限定理,阐述大量随机变量之和分布趋近于收敛于正态分布的一系列定理统称为中心极限定理。,独立同分布的中心极限定理,(也称列维一林德伯格定理)设X1, X

11、2, 是独立同分布的随机变量序列,且存在有限的和方差2i=1,2,),当n 时,,或,上述定理表明独立同分布的随机变量序列不管服从什么分布,其n项总和的分布趋近于正态分布。可得出如下结论:不论总体服从何种分布,只要其数学期望和方差存在,对这一总体进行重复抽样时,当样本量n充分大,就趋于正态分布。,棣莫佛拉普拉斯中心极限定理,设随机变量X服从二项分布B(n,p)的,那么当n 时,X服从均值为np、方差为 np(1-p) 的正态分布,即:,或:,上述定理表明: n很大,np 和 np(1p)也都不太小时,二项分布可以用正态分布去近似。,中心极限定理(central limit theorem),中

12、心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,中心极限定理 (central limit theorem),x 的分布趋于正态分布的过程,抽样分布与总体分布的关系,样本均值的数学期望样本均值的方差重复抽样不重复抽样,样本均值的抽样分布(数学期望与方差),样本均值的抽样分布(数学期望与方差),比较及结论:1. 样本均值的均值(数学期望) 等于总体均值 2. 样本均值的方差等于总体方差的1/n,均值的抽样标准误差,所有可能的样本均值的标准差,测度所有样本均值的离散程度也称标准误差小于总体标准差计算公式为

13、,中心极限定理的应用,某汽车电瓶商声称其生产的电瓶具有均值为60个月、标准差为6个月的寿命分布,现假设质量检验部门决定检验该厂的说法是否正确,为此随机抽取了50个该厂生产的电瓶进行寿命试验。(1假设厂商声称是正确的,试描述50个电瓶的平均寿命的抽样分布。(2假定厂商声称正确,则50个样品组成的样本均值不超过57个月的概率是多少?,样本比例的抽样分布,总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品) 与全部产品总数之比总体比例可表示为样本比例可表示为,比例(proportion),在重复选取容量为的样本时,由样本比例的所有可能取值形成的相对频数分

14、布一种理论概率分布当样本容量很大时,样本比例的抽样分布可用正态分布近似 推断总体比例的理论基础,样本比例的抽样分布,样本比例的数学期望样本比例的方差重复抽样不重复抽样,样本比例的抽样分布(数学期望与方差),样本方差的抽样分布,样本方差的分布,在重复选取容量为的样本时,由样本方差的所有可能取值形成的相对频数分布对于来自正态总体的简单随机样本,则比值 的抽样分布服从自由度为 (n -1) 的2分布,即,由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特(Hermert)和卡皮尔逊(KPearson) 分别于1875年和1900年推导出来设 ,那么令 ,那么 Y 服从自由度为1的2分布,即 当

15、总体 ,从中抽取容量为n的样本,那么,2分布(2 distribution),分布的变量值始终为正 分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称 期望为:E(2)=n,方差为:D(2)=2n(n为自由度) 可加性:若U和V为两个独立的2分布随机变量,U2(n1), V2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布,2分布(性质和特点),c2分布(图示),6.4 样本统计量的抽样分布 (两个总体参数推断时),6.4.1 两个样本均值之差的抽样分布6.4.2 两个样本比例之差的抽样分布6.4.3 两个样本方差比的抽样分布,两个样本均值之差

16、的抽样分布,两个总体都为正态分布,即 , 两个样本均值之差 的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差 方差为各自的方差之和,两个样本均值之差的抽样分布,两个样本均值之差的抽样分布,两个样本比例之差的抽样分布,两个总体都服从二项分布分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,两个样本比例之差的抽样分布可用正态分布来近似分布的数学期望为方差为各自的方差之和,两个样本比例之差的抽样分布,两个样本方差比的抽样分布,两个样本方差比的抽样分布,两个总体都为正态分布,即X1N(1 ,12),X2N(2 ,22 )从两个总体中分别抽取容量为n1和n2的独立样本两个

17、样本方差比的抽样分布,服从分子自由度为(n1-1),分母自由度为(n2-1) 的F分布,即,由统计学家费希尔(R.A.Fisher) 提出的,以其姓氏的第一个字母来命名则设若U为服从自由度为n1的2分布,即U2(n1),V为服从自由度为n2的2分布,即V2(n2),且U和V相互独立,那么 称F为服从自由度n1和n2的F分布,记为,F分布(F distribution),F分布(图示), 不同自由度的F分布,t-分布 假设 XN(0,1), Y2(n),且X与Y相互独立,则称,服从自由度为 n 的 t-分布, 记作tt(n).假设 Xt(n), 则有E(X)=0, Var(X)=n /(n-2) .阐明: 当样本容量n 较小时, t-分布与正态分布差异较大, 当样本容量n 较大(n30)时, t-分布与正态分布基本一致。,本章小结,概率抽样方法总体分布、样本分布、抽样分布单总体参数推断时样本统计量的分布双总体参数推断时样本统计量的分布,结 束,THANKS,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1