用样本推断总体PPT精选文档.ppt

上传人:rrsccc 文档编号:9924447 上传时间:2021-04-04 格式:PPT 页数:44 大小:495.50KB
返回 下载 相关 举报
用样本推断总体PPT精选文档.ppt_第1页
第1页 / 共44页
用样本推断总体PPT精选文档.ppt_第2页
第2页 / 共44页
用样本推断总体PPT精选文档.ppt_第3页
第3页 / 共44页
用样本推断总体PPT精选文档.ppt_第4页
第4页 / 共44页
用样本推断总体PPT精选文档.ppt_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《用样本推断总体PPT精选文档.ppt》由会员分享,可在线阅读,更多相关《用样本推断总体PPT精选文档.ppt(44页珍藏版)》请在三一文库上搜索。

1、1,用样本推断总体,2,问题一:,二战中的点估计德军有多少辆坦克? 二战期间,盟军非常想知道德军总共制造了多少辆坦克。德国人在制造坦克时是墨守成规的,他们把坦克从1开始进行了连续编号。在战争过程中,盟军缴获了一些敌军坦克,并记录了它们的生产编号。那么怎样利用这些号码来估计坦克总数呢?我们可以通过本章点估计的方法解决这个问题。,3,问题二,某人想知道自己所承包的池塘的鱼的总数N,第一次随机捞出50条,将这50条鱼作标记后又放回池塘,等它们完全融入其他鱼后又随机捕捞100条,发带有标记的鱼有2条,你能帮他估计出鱼塘里现鱼的数量N吗? 解:已作记号的鱼的样本比例为 那么总体(池塘里的所有鱼)中作记号

2、的鱼的比例为 既有:50/N=0.02 故:N=50/0.02=2500 这是一个典型的用样本比例来估计总体比例从而再推断总体单位总量的实例。,4,统计推断的过程,5,参数估计的方法,6,点估计,从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计 例如: 用样本均值作为总体未知均值的估计值就是一个点估计 2.点估计没有给出估计值接近总体未知参数程度的信息 点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等,7,被估计的总体参数,8,1. 用于估计总体某一参数的随机变量 如样本均值,样本比例、样本中位数等 例如: 样本均值就是总体均值的一个估计量 如果样本均

3、值 x = 3 ,则 3 就是 的估计值 理论基础是抽样分布,估计量,9,估计量的优良性准则,无偏性:估计量的数学期望等于被估计的总体 参数,10,估计量的优良性准则(有效性),有效性:一个方差较小的无偏估计量称为一个更 有效的估计量。如,与其他估计量相比 ,样本均值是一个更有效的估计量,11,估计量的优良性准则(一致性),一致性:随着样本容量的增大,估计量越来越接近被估计的总体参数,12,区间估计,1.根据一个样本的观察值给出总体参数的估计范围 给出总体参数落在这一区间的概率 例如: 总体均值落在5070之间,置信度为 95%,13,置信区间估计(内容),14,落在总体均值某一区间内的样本,

4、15,总体未知参数落在区间内的概率 表示为 (1 - 为显著性水平,是总体参数未在区间内的概率 常用的显著性水平值有 99%, 95%, 90% 相应的 为0.01,0.05,0.10,置信水平,16,置信区间与置信水平,均值的抽样分布,(1 - ) % 区间包含了 % 的区间未包含,17,影响区间宽度的因素,数据的离散程度,用 来测度 样本容量 置信水平 (1 - ),影响 Z 的大小,18,总体均值的置信区间( 已知),1.假定条件 总体服从正态分布,且总体方差()已知 如果不是正态分布,可以由正态分布来近似 (n 30) 2. 使用正态分布统计量,总体均值 在1-置信水平下的置信区间为,

5、19,总体均值的区间估计(正态总体),解:已知N(,0.152),x2.14, n=9, 1- = 0.95,/2=1.96 总体均值的置信区间为,我们可以95的概率保证该种零件的平均长度在21.30221.498 mm之间,【例】某种零件长度服从正态分布,从该批产品中随机抽取件,测得其平均长度为21.4 mm。已知总体标准差 =0.15mm,试建立该种零件平均长度的置信区间,给定置信水平为0.95。,20,总体均值的区间估计(非正态总体),解:已知 x26, =6,n=100, 1- = 0.95,/2=1.96,我们可以95的概率保证平均每天参加锻炼的时间在24.82427.176 分钟之

6、间,【例】某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟。试以95的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为36小时)。,21,总体均值的置信区间 ( 未知),1.假定条件 总体方差()未知 总体必须服从正态分布 使用 t 分布统计量,3. 总体均值 在1-置信水平下的置信区间为,22,总体均值的区间估计,解:已知N(,2),x=50, s=8, n=25, 1- = 0.95,t/2=2.0639。,我们可以95的概率保证总体均值在46.6953.30 之间,【例】从一个正态总体中抽取一个随机样本, n = 25 ,其均值x =

7、 50 ,标准差 s = 8。 建立总体均值m 的95%的置信区间。,23,总体比例的置信区间,1.假定条件 两类结果 总体服从二项分布 可以由正态分布来近似 使用正态分布统计量,3. 总体比例 的置信区间为,24,总体比例的置信区间实例,我们可以95的概率保证该企业职工由于同管理人员不能融洽相处而离开的比例在63.6%76.4%之间,【例】某企业在一项关于职工流动原因的研究中,从该企业前职工的总体中随机选取了200人组成一个样本。在对其进行访问时,有140人说他们离开该企业是由于同管理人员不能融洽相处。试对由于这种原因而离开该企业的人员的真正比例构造95%的置信区间。,25,根据均值区间估计

8、公式可得样本容量n为,估计总体均值时样本容量的确定,样本容量n与总体方差2、允许误差、可靠性系数Z之间的关系为 与总体方差成正比 与允许误差成反比 与可靠性系数成正比,其中:,26,样本容量的确定实例,解:已知2=1800000,=0.05, Z/2=1.96,=500,应抽取的样本容量为,【例】一家广告公想估计某类商店去年所花的平均广告费用有多少。经验表明,总体方差约为1800000元。如置信度取95%,并要使估计处在总体平均值附近500元的范围内,这家广告公司应抽多大的样本?,27,根据比例区间估计公式可得样本容量n为,估计总体比例时样本容量的确定,其中:,28,样本容量的确定实例,【例】

9、一家市场调研公司想估计某地区有彩色电视机的家庭所占的比例。该公司希望对比例p的估计误差不超过0.05,要求的可靠程度为95%,应抽多大容量的样本(没有可利用的p估计值)。,应抽取的样本容量为,29,正态总体方差的区间估计,1. 估计一个总体的方差或标准差 2. 假设总体服从正态分布 3. 总体方差 2 的点估计量为S2,且,4. 总体方差在1-置信水平下的置信区间为,30,正态总体方差的区间估计实例,【例】对某种金属的10个样品组成的一个随机样本作抗拉强度试验。从实验数据算出的方差为4。试求2的95%的置信区间。,31,正态总体方差的区间估计计算结果,解:已知n10,s2 4,1-95% 2置

10、信度为95%的置信区间为,32,从某学院男生中随机抽取30 名学生,测得身高(cm ) 分别为170 、175 、172 、168 、165 、178 、180 、176 、177 、164、.,数据如下表,以95% 的置信度估计该学院男生的平均身高。,利用Excel计算置信区间,33,34,利用Excel计算必要样本数,例:某县进行农村经济情况调查,已知农户平均年收入标准差为30元,要求把握程度(置信度)为95.45%,抽样极限误差为5元,计算应抽取的样本户数?如下图所示。,35,“样本容量计算”工作表,必要样本容量计算,计算公式,36,建立工作表,样本比例为p, 样本容量为n,计算公式,3

11、7,区间估计总结,38,注:,39,区间估计必要样本容量n的确定,其中:,其中:,40,帮想节约调查费用的广告公司拿主意,某广告公司为了估计某地区收看某一新电视机目的居民人数所占比例,要设计一个简单随机样本的抽样方案。该公司希望有90%的信心使所估计的比例只有2个百分点左右的误差。为了节约调查费用,样本将尽可能小,在这种情况下应该抽取多少样本?,案例一,41,总统选举的民意调查(背景),据美国竞选业专业杂志 Campaigning Reports统计历次美国总统竞选的花费: 2004年为6.93亿美元;2008年高达13亿美元。整个总统竞选过程中,候选人一般会花费10-15%的竞选经费在民意调

12、查上。如何确定被调查的人数是首先要考虑的问题。,案例二,42,学生每天上网的时间的区间,一、某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间(单位:小时) ,得到下面数据。要求:该校大学生平均上网时间的置信区间,置信概率为90% 上网时间 3.3, 4.4, 2.1, 4.7, 3.1, 2, 1.9, 1.4, 6.2, 5.4, 1.2, 1.2, 5.8, 2.6 ,5.1, 2.9, 2.3, 6.4, 4.3, 3.5, 4.1, 1.8,4.2 ,2.4, 5.4, 3.5, 3.6, 0.5, 4.5, 5.7, 0.

13、8, 3.6 3.2, 2.3, 1.5, 2.5,案例三,43,汽车性能调查,调查消费者对上海地区某一个主要制造商所生产的汽车的性能的满意程度。许多人抱怨该车刚开始传动系统不佳为了更好地了解传动系统的问题,采用由上海一个修理企业所提供的实际传动系统的维修记录为样本。以下数据为50辆汽车传动系统出现故障时所行驶的实际里程的数据。求95%的置信区间,案例四,85092 32609 59465 77437 32534 64090 32464 59902 39323 89641 94219 116803 92857 63436 65605 85861 64342 61978 67998 59817 101769 95774 121352 69568 74276 66998 40001 72069 25066 77098 l69922 35662 74425 67202 118444 53500 79294 64544 86813 116269 37831 89341 73341 85288 138114 53402 85586 82256 77539 88798,44,本讲小结,1.点估计和区间估计的有关概念 2.区间估计(均值、均值差、比例) 3.确定样本容量 4. 使用Excel函数,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1