统计推断准备.ppt

上传人:少林足球 文档编号:3615234 上传时间:2019-09-18 格式:PPT 页数:42 大小:894.60KB
返回 下载 相关 举报
统计推断准备.ppt_第1页
第1页 / 共42页
统计推断准备.ppt_第2页
第2页 / 共42页
统计推断准备.ppt_第3页
第3页 / 共42页
统计推断准备.ppt_第4页
第4页 / 共42页
统计推断准备.ppt_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《统计推断准备.ppt》由会员分享,可在线阅读,更多相关《统计推断准备.ppt(42页珍藏版)》请在三一文库上搜索。

1、第一章 统计推断准备,0.预备知识 0.1 大数定律与中心极限定理 阐明大量随机现象平均结果的稳定性的一系列定理统 称大数定律,而研究独立随机变量的和的极限分布在 什么条件下为正态分布的一类定理叫中心极限定理。 0.1.1车贝雪夫不等式 设随机变量 有期望 和方差 ,则对任意 ,有,0.1.2大数定律 定义:若 随机变量序列,如果存在常数列 使得对任意的 有 成立,则称随机变量序列 服从大数定律. 定理1(贝努里大数定律)设 是n重贝努里试验中事件A出现的次数,又A在每次试验中出现的概率为p(0p1),则对任意的 ,有:,定理2(车贝雪夫大数定律)设 是一列两两不相关的随机变量,又设他们的方差

2、有界,既存在常数C0,使有 则对任意的 ,有 例1.: 设 为独立同分布的随机变量序列,均服从参数为 的泊松分布 则 定理3(辛钦大数定律)设 是一列独立同分布的 随机变量,且数学期望存在, 则对任意的 有,0.1.3.中心极限定理 定理1(林德贝格-勒维定理)若 是独立同分布 的随机变量序列,且 则随机变 量 ,其中 的分布函数 对一切x, 有: 即随机变量 渐近地服从标准正态分布。 定理2(德莫佛-拉普拉斯定理)设 是n重贝努里试验中事件A出现的次数,而0p1是事件A在每次试验中出现的概率,则 渐近的服从正态分布 ,其中q=1-p或,例2:有一批建筑房屋用的木柱,其中80%的长度不小于3米

3、,现从这批木柱中随机地取出100根,问其中至少有30根短于3米的概率是多少? 例3:某车间有200台车床,独立工作,开工率为0.6,开工时耗电各为1000瓦,问供电部门至少要供给这个车间多少电力才能使99.9%的概率保证这个车间不会因为供电不足而影响生产。 例4:一加法器,同时收到20个噪声电压 设他们是相互独立的,且在区间(0,10)上服从均匀分布的随机变量,记 ,求,1基本概念 1.1总体与样本,总体:研究对象的全体,记为X或 ,是指一个随机变量。 个体:组成总体的每个单元。 样本:就是n个相互独立且与总体有相同概率分布的随机变量 ,i=1,2,n,所组成的n维随机变量 样本值:每一次具体

4、的抽样所得的数据就是n个随机变量的值(样本值)用小写字母 表示。 注:样本具有双重性,即它本身是随机变量,但一经抽取便是一组确定的具体值。 定义:若随机变量 相互独立且每个 ,i=1,2,n,与总体 有相同的概率分布,则称随机变量 为来自总体 的容量为n的简单随机样本,称 ,i=1,2,n为样本的第i个分量。若 有分布密度 (或分布函数 )则 称 是来自总体 (或 )的样本.,1.2统计量 定义:设 为总体 的一个样本, 为一个实值函数,如果T中 不包含任何未知参数,则称 为一个统计量。统计量的分布称为抽样分布。 例如:总体 ,a已知, 未知, 为 的一个样本,则 是统计量,但 不是统计量。

5、1.3顺序统计量及经验分布 1.3.1顺序统计量 设 为总体, 的一个样本,将其诸分量 ,i=1,2,n,按由小到大的次序重新排列为 ,即 ,称 为总体的第k个顺序统计量(次序统计量),特别 称为最小项统计量, 为最大项统计量。,例1.5:设有一个总体,它以等概率取0,1,2三个值,现从此总体中取容量为2的一个样本 , 列出样本 所有可能取值情况和相应的次序统计量 的情况。,1.3.2经验分布 由给定的样本 定义一个函数, 此函数的性质: (1)当样本固定时,作为x的函数是一个阶梯形的分布函数, 恰为样本分量不大于x的频率。 (2)当x固定时,它是一个统计量,其分布由总体的分布所确定。 即 (

6、二项分布) 称 为总体对应于样本 的经验分布函数。,1.4常用的一些统计量 1.4.1样本的分位数 设 为总体, 为样本, 为顺序统计量,定义 称 为样本的 分位数。当 =1/2时,称 为样本的中位数。(也用 表示) 例1.6:若 (1.5,2.0,4.0,0,8,3.5,9), 则 ? 1.4.2.样本的极差 称为样本的极差,1.4.3样本分量的秩 若 ,则称 的秩为j,记作 ,它表示样本第 个分量 ,处于顺序统计量中的位次。 1.4.4.样本矩 设 为总体 取出的容量为n的样本, 统计量 叫样本均值; 统计量 叫样本方差 (而称 叫修正的样本方差); 统计量 ,(r =1,2,)叫样本的r

7、阶原点矩; 统计量 ,(r =1,2,)叫作样本的r阶中心矩。,1.4.5二元总体的样本矩 设 为二元随机变量, , , 为其 样本,称 为 的边际样本方差; 为 的边际样本方差; 为样本的协方差; 为样本的相关系数。,2.常用统计量的抽样分布 2.1顺序统计量的分布(次序统计量) 2.1.1定义 设( )是来自总体 的一个样本, ( )是该样本的一组观察值,将它按由小到大的次序排列成 ,如果规定 的取值为 , k=1,2,n,则称 为( )的一组次序统计量,而称 为第k个次序统计量。(见 1.3.1) 2.1.2连续型总体次序统计量的分布(仅给出结论) 定理2.1设总体 , , 为 的一个样

8、本,则第k个次序统计量 的概率密度函数为: 分布函数为:,特别: 当k=1时,得样本极小值 的分布密度与分布函数为: 当k=n时,得样本极大值 的分布密度与分布函数为:,定理2.2 设总体X的分布函数为 ,概率密度函数为 , 为X的一个样本,则第k个次序统计量与 第r个次序统计量的联合概率密度函数为(kr) 定理2.3设总体X的分布函数为 ,概率密度函数为 , 为X的一个样本,则S个次序统计量 的联合概率密度为,定理2.4(定理2.3的特殊情形)设总体X的分布函数为 , 概率密度函数为 , 为X的一个样本, 则前r个次序统计量 的联合概率密度函数 为( ) 特别:当r=n时,得n个次序统计量

9、的联合概率密度函数为 注:n个次序统计量不是相互独立的, 即次序化破坏了简单随机样本的独立性。,定理2.5(极差的分布)令 , 则 的分布函数和密度函数分别为:,例2.1:设总体 有分布密度为 , 为 从 取出的容量为4的样本的顺序统计量,求 的分布 函数 , 例2.2:设总体X服从区间(0,1)上的均匀分布,其分布 函数与概率密度函数分别为: 为X的一个样本,求第k个次序统计量 的概率密度函数 。,例2.3:设总体X服从参数 为的指数分布,其分布函数与概率密度函数分别为: 为X的一个样本,求 的密度函数, 的密度函数, 极差 = - 的密度函数, 的联合密度 函数 。 例2.4:设总体X服从

10、指数分布,其概率密度函数为 是容量为n的样本 的前r个次序统计量,则 都服从参数为 的指数分布,且 相互独立 。 例2.5:在上述条件下,则,3 n个重要统计量的分布 3.1正交矩阵与正态分布 定理3.1设 相互独立,且都服从 , 而A= 是n阶正交矩阵, , 则 必相互独立,且都服从 定理3.2设 相互独立,且 , A= 是n阶正交矩阵, , 则 必相互独立,且,3.2 三个重要分布 3.2.1 分布 定义:称随机变量 有 分布,自由度为n,如果他有密度 定理3.3设 相互独立,且都服从 ,则 定义: 的上侧 分位数 ,即,的性质: (1) (2)若 , 且X与Y独立, 则X+Y 注:1.如

11、果 相互独立且 ,则 的上侧 分位数 ,即 设X ,则对 有 即:当n很大时, ,或X,4. 当n45时,本书附表 中查不到,但可以利用注3求其近似值,即 由于 , 则: 例如:求 , , 所以,3.2.2 t-分布 定义:称随机变量 有t-分布,自由度为n,如果它有密度函数 定理3.4 设X ,Y ,且X与Y相互独立, 则T= . 定义: 的上侧 分位数 ,即 注:当自由度 时, 的极限分布为标准正态分布 当n45时,,3.2.3 F-分布 定义:称随机变量 有F-分布,自由度为 ,如果它有密度 定理3.5 设X ,Y 且X与Y相互独立,则 注:若X ,则1/X 定义: 的上侧 分位数 ,即

12、 , 注: =1/,3.2.4 查表 1. 标准正态分布表: 2. 分布表: 3. 分布表: 4. 分布表:,3.3抽样分布定理 定理4.6(Fisher定理)设总体 服从 , 为其子样,子样的平均值与方差,修正的样本方差分别 记为 与 及 ,则(1) , (2) (3) 与 (或 )独立 推论:设总体 服从 , 为其子样,则,定理3.7 设 与 分别为取自 , 的两个样本,且这两个样本独立, 则1. 2. 若 ,则 其中,,定理3.8 (柯赫伦cochran定理)( 变量分解定理)设总体 , 为其子样, 且 为秩为 的关于 的二次型, 则 ,l=1,k相互独立,且 ,l=1,2,k 例3.1

13、:设总体 , 为其子样,试证: 与 相互独立,且分别服从 ,,4.总体分布的近似描述 4.1格列汶科定理 对任意实数x,当 时, 格里汶科定理表明:在几乎处处的意义下,当n 充分大时,对x一致地有 F(x)非常接近。由此可见当n较大时,用经验分布函数估计总体分布函数是合理有效的。,4.2 直方图 对于连续型随机变量,其分布函数或密度函数能完整地描述它的取值规律性,给出分布函数或密度函数是等价的。 直方图能反映总体密度曲线的大致形状。,设X的分布函数和密度函数分别用F(X),f(x)表示: 当 很小时,有 表明:密度函数在x处的值f(x)近似等于随机变量X落入含有x的小区间的概率除以小区间的长度

14、。 概率可以用频率近似。,设来自X的样本观测值为 , 考察其中每个值是否属于 看作一次试验,则 即f(x)与单位长度的频率近似相等,称单位长度的频率为频率密度。,编制频数分布表的一般步骤: 1.计算极差: 2.计算组距:组距=组上限-组下限 3.确定组限:选a(略小于或等于 ,,例4.1 某厂生产一种25瓦的白炽灯泡,其光通量(单位:流明)用X表示,从这批灯泡中抽取容量为60的样本,进行观察得光通量数据如下: 216 203 197 208 206 209 206 208 202 221 206 213 218 207 203 202 194 203 202 193 203 213 211 1

15、98 213 208 204 206 204 206 208 209 213 203 206 207 196 201 208 207 213 208 210 208 211 214 220 211 203 216 224 211 209 218 214 219 211 221 211 218 试编制频数分布表,并绘制频率密度直方图。,解. 1.极差:R=224-193=31 2.计算组距:d=31/7=4.43 3.确定组范围: 190,195), 195,200), 200,205), 205,210), 210,215), 215,220), 220,225.,按光通量分组频数分布表,频率

16、密度直方图 (P.18) 图1.6 频率密度分布曲线图 (P.19) 图1.7,5.杂例 例5.1:在总体 中随机抽一容量为36的样本,求样本均值 落在50.8到53.8之间的概率。 例5.2:在总体 中取容量为5的样本 , (1)求样本均值与总体均值之差的绝对值大于1 的概率 (2)求 (3)求 例5.3:求总体 的容量分别为10,15的两个独立样本均值差的绝对值大于0.3的概率。,例5.4:设 为 的一个样本,求 例5.5:设 是来自 的样本,求 例5.6:已知 ,则 例5.7:设 为总体X的一个样本, 求 , 例5.8:设在总体 中抽取一容量为n的样本, 未知,(1)求 , ; (2)当n=16时,求,例5.9:设 为总体X的一个样本, , , 为第n+1次的观察结果,试证: (1) 例5.10:设 是来自正态总体X的简单随机样本, 则 例5.11:设 是取自正态总体X 的一个样本,求,例5.12.:设X服从 , 为来自总体X的简单随机样本, 试求常数C,使CY 分布 例5.13:设总体X在( )( )上服从均匀分布, 为其子样,求 及极差 的数学期望 。 例 5.14:设总体 服从 和 分别为样本均值和样本方差,又设 且与 独立。 求统计量 的抽样分布。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1