第八章ppt课件.ppt

上传人:本田雅阁 文档编号:3159762 上传时间:2019-07-17 格式:PPT 页数:40 大小:1,009.03KB
返回 下载 相关 举报
第八章ppt课件.ppt_第1页
第1页 / 共40页
第八章ppt课件.ppt_第2页
第2页 / 共40页
第八章ppt课件.ppt_第3页
第3页 / 共40页
第八章ppt课件.ppt_第4页
第4页 / 共40页
第八章ppt课件.ppt_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《第八章ppt课件.ppt》由会员分享,可在线阅读,更多相关《第八章ppt课件.ppt(40页珍藏版)》请在三一文库上搜索。

1、第八章,参数估计,第一节 参数估计的一般问题 第二节 单总体参数的区间估计 第三节 样本容量的确定,本章内容,第一节 参数估计的一般问题,参数估计在统计方法中的地位,一、抽样推断 抽样推断的概念:按照随机性原则,从研究对象中抽取一部分进行观察,并根据所得到的观察数据,对研究对象的数量特征做出具有一定可靠程度的估计和推断,以达到认识总体的一种统计方法。 抽样推断的特点: 1.样本资料对总体的数量特征作出具有一定可靠性; 2.按照随机性原则从全部总体中抽取样本单位; 3.抽样推断必然会产生抽样误差。,二、参数估计的一般问题 (一)参数估计(parameter estimation)的概念:就是用样

2、本统计量去估计总体的参数。 估计量:用于估计总体参数的随机变量 如样本均值,样本比例、样本方差等 例如: 样本均值就是总体均值 的一个估计量 参数用 表示,估计量用 表示 估计值:估计参数时计算出来的统计量的具体值 如果样本均值 x =5600,则5600就是的估计值,表8-2 样本统计量和总体参数符号对应关系,(二)点估计与区间估计 1.点估计:根据样本统计量直接估计出总体参数的值,称为参数的点估计。常用的方法有两种:矩估计法和极大似然估计法。 2.区间估计:在点估计的基础上,给出总体参数估计的一个范围。图8-1给出了区间估计的示意图:,图8-1 区间估计的图示,3. 在区间估计中,由样本统

3、计量所构造的总体参数的估计区间,称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。 4.置信水平:如果将构造置信区间的步骤重复多次,置信区间包含总体参数真值的次数所占的比率。 5.比较常用的置信水平及正态分布曲线下的右侧面积为时的值(即临界值Z/2)。,表8-3 常用置信水平的值,图8-3 重复构造出置信水平95%,的20个置信区间,三、评估估计量的标准,无偏性:估计量抽样分布的数学期望等于被 估计的总体参数,图8-4,一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数,图8-5,有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效.,图 8-6

4、,第二节 单总体参数的区间估计,一、总体均值的区间估计,(一)大样本的估计方法 1.样本均值经过标准化以后的随机变量则服从正态分布,即 2.总体均值所在(1-)置信水平下的置信区间为:,(8.2),(8.1),称为置信下限,,称为置信上限。,例1一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量(单位:g)如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%。,表8-3 25袋食品的重量,即:该批食品平均重量95%

5、的置信区间为101.44g109.28g。,利用Excel来计算置信区间,1.将样本数据输入Excel工作表中A1:E5,2.计算样本均值。点击粘贴函数“fx”,选择“统计”下的“AVERAGE”函数。在出现的“函数参数”对话框中,“Number1”一栏填入样本数据所在区域A1:E5,然后“确定”,在输出区域内(本例放置在F1)得结果105.36,此即样本均值 。,3.计算样本标准差,选择的函数为“统计”下的“STDEV”函数。本例放在G1,得结果9.6545.,4.计算允许误差。选择“统计”下的“CONFIDENCE”函数,在出现的“函数参数”对话框中,“Alpha”一栏填入显著性水平“0.

6、05”,“Standard_dev”一栏填入总体标准差“G1”(大样本情况下,可用样本标准差代替),“Size”一栏填入样本容量“25”,然后“确定”,在输出区域内得允许误差“3.784490”(取近似值3.78)。,5.置信下限为105.363.78101.58,置信上限为105.363.78109.14,即置信区间为(101.58,109.14)g。,(二)小样本的估计方法 总体方差2未知,而且是在小样本的情况下,则需要用样本方差S2代替2,这时样本均值经过标准化以后的随机变量则服从自由度为(n-1)的t分布,即:,(8.4),t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和

7、分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布 ,如图87和图88所示:,图87 图88,总体均值 在1-置信水平下的置信区间为:,(8.5),式中:是自由度为n-1时,t分布中上侧面积为/2时的临界值,该值可通过t分布表查得。,利用Excel中的TINV统计函数 计算t分布临界值,t分布临界值可通过Excel中的TINV统计函数来计算。点击粘贴函数“fx”,选择“统计”下的“TINV”函数。在对话框中,“Probability”一栏填入显著性水平(本例为0.05),“Deg_freedom”填入自由度(本例为15),然后“确定”。得结果“2.13145

8、”,此即t分布的临界值。,例已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(单位:h)如表85。建立该批灯泡平均使用寿命95%的置信区间。,表85 16只灯泡使用寿命数据,解:根据样本数据,计算样本均值=1490h,样本方差S=24.77h 根据=0.05查t分布表得(n-1)=t0.025 (15)=2.131 于是,平均使用寿命的置信区间为:,即全部灯泡的平均使用寿命,在置信水平10.95下的置信区间为(1476.8,1503.2)h。,总结:,表86 总体均值的区间估计,二、总体比例的区间估计,1. 样本比例经标准化后的随机变量则服从正态分布,即:,(8.6

9、),2. 总体比例在1-置信水平下的置信区间为:,(8.7),式中:1-称为置信水平; 是标准正态分布上侧面积为/2时的临界值; 是估计总体比例时的允许误差。,例为了解某城市家庭电脑的普及情况,随机抽取了100户家庭,其中有60户有电脑。试以95的置信水平估计该城市家庭中拥有电脑比例的置信区间。,解:已知 n100,n160 , 则样本比例为:p60 由于1 = 95%,查标准正态分布表可知,Z/2=1.96。 于是 即该城市家庭中,拥有电脑的比例在置信水平95下的置信区间为:(50.396,69.604)。,三、总体方差的区间估计,总体方差在(1-)置信水平下的置信区间为:,例一家食品生产企

10、业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间。,表87 25袋食品重量,解:根据样本数据计算样本方差: S2 =93.21; 已知n25,1-95% ,查2分布表可得临界值为: 总体方差 2置信水平为95%的置信区间为 : 即:总体方差的置信区间为(56.83,180.39)。 相应地,企业生产的食品总体重量标准差的的置信区间为7.54g13.43g。,第三节 样本容量的确定,一、估计总体均值时样本容量的确定,一旦确定了置信水平(1-), 的值就确定了,对于给定的的值和总

11、体标准差,就可以确定任一希望的允许误差所需要的样本容量。令E代表所希望达到的允许误差,即:,由此可以推到出确定样本容量的公式如下:,(8.8),(8.9),例拥有MBA学位的研究生年薪的标准差大约为4000元,假定想要估计年薪95%的置信区间,希望允许误差为10000元,应抽取多大的样本容量?,解:已知 =4000,E1000, 1=95%, Z/21.96,所以,应抽取的样本容量为: 即应抽取62人作为样本。,二、估计总体比例时样本容量的确定,一旦确定了置信水平(1-), 的值就确定了。由于总体比例的值是固定的,所以允许误差由样本容量来确定,样本容量越大允许误差就越小。估计的精度就越好。因此,对于给定的的 值,就可以确定任一希望的允许误差所需要的样本容量。令E代表所希望达到的允许误差,即: 由此可以推导出重复抽样和无限总体抽样条件确定样本容量的公式如下:,(8.10),(8.11),例10某社区想通过抽样调查了解居民参加体育活动的比率,如果把误差范围设定在5,问如果以95的置信水平进行参数估计,需要多大的样本?,解:由于1-=0.95,=0.05, =1.96。 因为的值不知道,取使(1)最大值的0.5,即取0.5,于是: 故需取385人的样本。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1