第七章参数估计-第七章.ppt

资源描述

《第七章参数估计-第七章.ppt》由会员分享，可在线阅读，更多相关《第七章参数估计-第七章.ppt（33页珍藏版）》请在三一文库上搜索。

1、第七章,参数估计,统计推断,统计推断 statistical inference,如：样本均数样本标准差S 样本率 P,如：总体均数总体标准差总体率,内容：参数估计(estimation of parameters) 包括：点估计与区间估计 2. 假设检验（test of hypothesis),统计推断,第一节样本均数的标准误,如：样本均数样本标准差S 样本率 P,如：总体均数总体标准差总体率,抽样误差（sampling error) ：由于个体差异导致的样本统计量与总体参数间的差别。,一、抽样试验,从正态分布总体N（5.00,0.502）中，每次随机抽取样本含量n5，并计

2、算其均数与标准差；重复抽取1000次，获得1000份样本；计算1000份样本的均数与标准差，并对1000份样本的均数作直方图。按上述方法再做样本含量n10、样本含量n30的抽样实验；比较计算结果。,抽样试验（n=5）,抽样试验（n=10）,抽样试验（n=30）,1000份样本抽样计算结果,3个抽样实验结果图示,例7-1 假设正常男子红细胞计数服从的正态分布总体，从该总体中重复进行100次抽样，每个样本的含量为10，结果见表7-1。（书本P105）,由表7-1可见，从同一总体中随机抽取样本含量n=10的若干样本，各样本算得的样本均数并不等于相应的总体均数，且各样本均数也不完全相同。这种由于随机

3、抽样而造成的来自同一总体的样本均数之间及样本均数与相应的总体均数之间的差异，称之为均数的抽样误差。,由于样本均数与相应的总体均数之间存在着差异，由数理统计推理可知：从正态总体中随机抽取样本含量为n的样本，每抽取一个样本可计算一个样本均数，重复100次抽样可得到100个样本均数。,这些样本均数服从均数为，方差为的正态分布.其中为样本均数的总体标准差，计算公式为：为了与反映个体差异的标准差（或）相区别，样本均数的标准差用表示。,统计上通常将统计量（如样本均数、样本率p等）的标准差称为标准误(standard error，SE）。所以，样本均数的标准差又称为样本均数的标准误，是反映样本均数

4、抽样误差大小的指标。,特点：总体标准误的大小与总体标准差成正比，与样本含量的平方根成反比。即当样本含量n一定时，标准差越大，即样本的个体差异越大，标准误就越大，样本均数的抽样误差就越大；标准差越小，标准误就越小，即样本均数抽样误差就越小。当一定时，n越大，就越小；n越小，就越大。故影响抽样误差大小的主要因素是样本含量。作为总体参数（常数）通常是未知的，因而，在实际工作中常用样本标准差S来估计。,抽样实验小结,均数的均数围绕总体均数上下波动。均数的标准差即标准误与总体标准差相差一个常数的倍数，即样本均数的标准误（Standard Error) =样本标准差/ 计算（例7-1，例7-2

5、）从正态总体N(m,s2)中抽取样本，获得均数的分布仍近似呈正态分布N(m,s2/n) 。,二、总体均数的估计,（一）总体均数的点估计（point estimation）与区间估计,参数的估计,点估计：由样本统计量直接估计总体参数,区间估计：在一定可信度（Confidence level）下，同时考虑抽样误差,统计学中的统计推断包括两个重要的方面：一是利用样本统计量的信息对相应总体参数值做出推断，如用样本均数估计总体均数，用样本标准差S估计总体标准差等，称之为点估计。另一个是利用样本统计量来推断我们是否接受一个事先的假设，称之为假设检验。本章只讨论参数估计，假设检验将在下一章中讨论。

6、而参数估计又分为点估计与区间估计。,1.点估计总体均数的点估计(point estimation)就是用样本均数来直接地估计总体均数，这种方法比较简单，由于没有考虑到抽样误差，只适合大样本资料的统计推断。,2.区间估计总体均数的区间估计(interval estimation)是利用样本信息给出一个区间，并同时给出重复试验时该区间包含总体均数的概率。,1）可信区间的涵义从总体中作随机抽样，对于含量为n的每个样本而言，都可以算得一个区间。以95%的可信区间为例，意味着在同一总体中作100次重复抽样，可得100个可信区间，平均有95个可信区间包含总体均数（估计正确），只有5个可信区间不包含总

7、体均数（估计不正确），或对于某一个区间而言，它包含总体均数的可能性为95%，而不包含总体均数的可能性仅为5%。因此在实际应用中，以这种方法估计总体均数犯错误的概率仅为5%。,2）可信区间具有两个要素 (1)准确度（accuracy），即可信区间包含的概率的大小，一般而言概率越大越好。 (2)精密度（precision），反映区间的长度，区间的长度越窄，估计的精密度越好，反之越差。,(1)总体标准差未知时 : 用样本标准差S 作为的估计值计算标准误，按t分布原理。（例7-4）,3)可信区间的计算,(2)总体标准差已知或总体标准差未知但n足够大: 按正态分布原理；当足够大时用作为估计值。（例7-5）,第二节率的标准误,一、率的抽样误差与标准误由于抽样造成的样本率之间及样本率与总体率之间的差别称为率的抽样误差。率的抽样误差大小可由率的标准误来衡量。,如果总体率未知，用样本率p估计,二、样本率的分布若，数理统计证明，从这个总体中抽样所得的样本量为n的样本，则样本率,三、总体率的估计（一）点估计直接用样本率去估计总体率。即：（二）区间估计当n足够大，且np与n(1-p)均大于5时，p的抽样分布近似正态分布（例7-6）,第三节两均数之差的可信区间,

展开阅读全文