第2章随机变量的概率分布与数字特征.ppt

上传人:本田雅阁 文档编号:2986804 上传时间:2019-06-20 格式:PPT 页数:63 大小:1.28MB
返回 下载 相关 举报
第2章随机变量的概率分布与数字特征.ppt_第1页
第1页 / 共63页
第2章随机变量的概率分布与数字特征.ppt_第2页
第2页 / 共63页
第2章随机变量的概率分布与数字特征.ppt_第3页
第3页 / 共63页
第2章随机变量的概率分布与数字特征.ppt_第4页
第4页 / 共63页
第2章随机变量的概率分布与数字特征.ppt_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《第2章随机变量的概率分布与数字特征.ppt》由会员分享,可在线阅读,更多相关《第2章随机变量的概率分布与数字特征.ppt(63页珍藏版)》请在三一文库上搜索。

1、第二章 随机变量的概率分布 与数字特征,第一节 离散型随机变量及其概率分布 第二节 连续型随机变量及其概率分布 第三节 随机变量的数字特征 第四节 三种重要分布的渐近关系 第五节 大数定律及中心极限定理,一、随机变量的概念,在第一章,我们介绍了随机事件及其概率,可以 看到很多事件都可采取数值标识。如抽检产品时出现 的废品个数;掷骰子出现的点数等。 对那些非数值标识的事件,实际上也可人为地加以 数值标识。例如,对新生儿的性别,可用0表示女,1 表示男;对生化检验的结果,可用0表示阴性,1表示 阳性;对生产的产品,可用2表示优质品,1表示次品, 0表示废品等。,因此,随机试验的结果可用一个变量来表

2、示,这种 随试验结果不同取不同数值的变量称为随机变量。,二、离散型随机变量及其概率分布,1、定义:按一定概率取有限个或可列个值的 随机变量,称为离散型随机变量。,设X所有可能取值为,(i=1,2,),称为离散型随机变量X的概率函数或分布律。,也可用表格来表示(称为概率分布表或分布列),2、概率函数(分布律),X,性质:(1) (2),(i=1,2,),例 设随机变量X的分布律为 (k=1,2,3,4,5) ,求: (1) P(X=1或X=2) (2),解 (1) P(X=1或X=2)=P(X=1)+P(X=2),=1/15+2/15=1/5,(2) =P(X=1)+P(X=2)+P(X=3),

3、=1/15+2/15+3/15=2/5,三、离散型变量的几种常见分布,1、伯努利概型,试验只有两种可能结果:A 及 , 把这个试验独立重复n次, 就构成了n重伯努利试验,简称伯努利试验。 设P(A)=p =1p=q(其中0p1),,例1 某药治某病的治愈率为p,现用此药治该病 5例,问治愈3例的概率是多少?,例2 袋中装有白球20个和黑球10个,每次抽一个: (1)作有放回抽取5次,求抽到白球3次的概率; (2)作无放回抽取5次,求抽到白球3次的概率。,解 治5例病人,看成做5次独立的试验。每次试验只有A=治愈 和 =未治愈两个结果。且P(A)=p,则这个试验是5重的伯努利试验,设B=治愈3例

4、=A出现3次,所以,解 (1)有放回抽球,可看成每次试验是独立的, 属于伯努利试验,令A=抽到白球且P(A)=2/3,故,(2)无放回抽球,说明每次试验间不独立,因此 不属伯努利试验,应看成古典概型。,无放回抽5次,可看成一次抽5个球,由古 典公式得,2、二项分布,(1)若随机变量X的概率函数为,(k=0,1,n),q=1-p,(2)性质,则称X服从二项分布,记为,由于各概率函数值 正好是二项式 展开式中的对应各项,故名二项分布。,例3 设 ,求P(X=4), P(2X6)。,解 因为,所以X的概率函数为,k=0,1,20,故,用查表法计算较简便,=0.793920.19579=0.59813

5、,遇到二项分布中概率p0.5时,不能直接查表 但可以转化为其对立事件的概率计算。,设X代表A出现次数,Y代表 出现次数,则 X+Y=n且,例4 XB(10,0.7),求,解,(3)二项分布的最可能值:使P(X=k)取最大值 的k值。即n重伯努利试验中事件A最可能 出现的次数。,例5 有10%的人对某药有肠道反应,为考察此药 的质量,现随机选5人服用此药,试求: (1)其中k(k=0,1,5)个人有反应的概率; (2)不多于2人有反应的概率; (3)有人有反应的概率。,解:随机选5人服药,各人间对药物的反应具有独立 性,且每人服药后有反应的概率均为视为0.1,这相当 于做5次独立重复试验,即p=

6、0.1,n=5的伯努利试验。 因而反应的人数XB(5,0.1),概率分布表如下,(2)不多于2人有反应的概率为,(3)有人有反应的概率为,3、泊松分布(稀有事件模型),在很多实际问题中,n重伯努利试验中的n往往 很大,p很小,则试验结果A出现的次数X,可看成 泊松分布。,正是因为结果A在n次试验中出现的次数非常少,故A可看作稀有事件。,(k=0,1,2.)其中参数,(1)概率函数,(2)性质,服从泊松分布的随机变量在实际中是很多的, 例如三胞胎出生次数,癌症发病人数,放射的粒子 个数,特大洪水发生的年数,抽检大量产品中出现 次品的件数,等等。,(3)泊松定理 在n重伯努利试验中,事件A 在一次

7、试验中出现的概率为p。若 , np也较小,则令 =np 有 (k=0,1,2,),从定理也可看出,事件A发生的次数X若服从参数 为 的泊松分布,则 表示A在大量试验中发生的 平均次数。,例6 已知某厂生产的针剂的废品率为0.01,400支 针剂中,废品至少有5支以上的概率是多少?,解:设400支针剂中废品数为X,检查400支针剂看 成做400次独立重复试验,即n=400;每次试验结果 为废品或正品,抽到废品的概率即p=0.01,则XB(400,0.01),可近似看成泊松分布,例7 某人在一次试验中遇到危险的概率是1%, 如果他在一年里每天都要独立重复做一次这样的 试验,那么他在一年中至少遇到一

8、次危险的概率 是多少?,解:此人做的试验可看成伯努利试验,n=365,每次 试验遇到危险的概率p=0.01,设他在一年中遇到危险的次数为X,则XB(365,0.01),因为n很大,p较小,可近似看成泊松分布,4、两点分布(01分布),(k=0,1),可以看出,两点分布即为二项 分布中n=1的特殊情况。,例8 一批产品共100件,其中有95件正品,5件废品, 从中任取一件,观察产品质量.若其结果用随机变量 X来描述,求X的概率函数。,解:设抽到正品,X=1;抽到废品,X=0,则X的分布律为,5、几何分布,(k=1,2,),引例 进行重复独立实验,设每次成功的概率为p, 将实验进行到出现一次成功为

9、止,以X表示所需 实验的总次数,求X的分布律。,6、超几何分布,引例 设有N件产品,其中有M件正品,现任取n件,求n件中恰有k件正品的概率。(以X表示n件中的正品数),k=0,1,2,l,其中l=Min(M,n),四、分布函数,1、定义: 设X是一随机变量,x为任意实数, 则称函数 为X的分布函数。,2、性质,F(x)在间断点处右连续,即,F(x)单调不减,3、常用公式,由此看出,已知X的分布函数就可知X在任一范围 内取值的概率,这说明分布函数全面地描述了 随机变量的分布情况。,4、离散型随机变量的分布函数,例 设某药检所从送检的药品中先后抽3件,如果 送检的10件中有2件失效,试列出检得次品

10、数的 概率分布表,并求出分布函数。,(分段函数),解 检得次品数为随机变量,设为X,则X的可取值为 0,1,2 ,由古典概率计算得,X的分布函数为,当x0时,,当 时,,当 时,,当 时,,即,如果取X的值于横轴, 的值于纵轴,便得到X 的概率函数图,它由几条 函数组成,每条线长的值 等于该点上的概率。,取X的值于横轴,F(x) 的值于纵轴,便得到X的 分布函数图。,此例中X是离散型随机变量, 由此可见离散型随机变量的分 布函数是台阶形,在分段点右 连续。,一、连续型随机变量概念,可取某个区间上所有值的变量。,3、连续型随机变量的分布函数,4、分布函数与密度函数之间的互化,重要公式:,例1 设

11、X的分布函数为 ,求 常数A、B及相应的密度函数。,解:由F(x)的性质,有,而,由上述方程解得,所以,例2,已知X的密度函数为,(1)求相应的分布函数F(x); (2)求 及,解,当 时,,当 时,,(1),当 时,,当x2时,,=1,(2),或,或,二、连续型随机变量的几种常见分布,1、正态分布,(1)分布形式,(2)图形与性质,特点是“两头小,中间大,左右对称”.,正态分布的密度曲线是一条 关于 对称的钟形曲线. x轴是f(x)的渐近线,可见 决定了图形的中心位置,称为位置参数; 决定了图形中峰的陡峭程度,称为形状参数.,左图 不变,右图 不变,(3)标准正态分布,标准正态分布函数,重要

12、公式:,若 ,则,XN(0,1),例1 设XN(0,1),求: (1) ; (2) (3),解 (1),查表得0.02275,(2),=0.02275,(3),例2 设XN(2,4),求: (1)f(5) (2)P(-4X2),解 由已知得 ,,(1),(2),例3 设 ,求,(1),(2),解 (1),(2),这个结果说明在一次试验中,服从正态分布的随机 变量X落在区间 内的概率相当大,即 X几乎必然落在上述区间内,这就是通常所说的“ ” 原理。,2、均匀分布,XUa,b,这说明X落在子区间的概率只与子区间的长度有关, 与子区间的位置无关。,(1)形式,设(c,c+l)是a,b上的一个子区间

13、,则,(2)分布函数,3、对数正态分布,若 ,则称X服从对数正态分布。,4、韦布尔分布、指数分布,5、 分布,一、均数(数学期望),引例 设有一批药材是由三个等级的药材组成,现 观察它的等级X。若有放回地抽取10件,其中有5件1等、 3件2等、2件3等,则所取的10件产品的平均等级是多少?,解 X的所有取值为1,2,3,10件产品的平均等级为,将上式改写成,这种把每个等级与相应的频率乘积的和,称为1,2,3 分别以5/10,3/10,2/10为权的加权平均。,我们知道,如果再抽取10件,平均等级就不一定 是1.7等了,可见由于抽样不同,抽样的平均等级也 不同,它是一个随机变量。但是,随着试验(

14、抽取 药材)的次数增大,出现1,2,3等品的频率就会逐渐 稳定在稳定在各自的概率附近。,设 表示第i(i=1,2,3)等药材出现的概率,则整 批药材的平均等级为,我们称这种加权平均值为均数,也叫数学期望。,1、离散型随机变量的均数,设离散型随机变量X的概率函数为,(i=1,2,3,),则规定X的均数,均数是反映随机变量取值的集中 趋势的一个数字特征。,解 :,2、连续型随机变量的均数,设连续型随机变量X的概率密度为f(x),则规定X 的均数为,例2 求在a,b上服从均匀分布的随机变量X的均数 EX。,解 依题意有,由定义得,3、常见分布的均数,(2)若XB(n,p),则EX=np,(3)若 ,

15、则,(4)若XUa,b,则,(5)若 ,则,(1)若X两点分布,则EX=p,4、均数的性质,(1)E(c)=c (c为常数),(2),(k为常数),(3),(k,b为常数),(4),(X与Y独立),解,二、方差,均数反映了随机变量取值的平均情况,它是随机 变量的一个重要数字特征,但只看均数是不够的,还 应知道随机变量的取值对均数的偏离程度。,引例 设有甲、乙两台制丸机生产同一种药丸的直径 (mm)的概率分布表如下,如果药丸的标准直径为7mm,问哪台机器的性能 更好?,解 易算出EX=EY=7,可见两台机器都是按标准生 产的。但是从分布可见,甲机器比乙机器生产的丸 径稳定,也就是甲生产的丸径与标

16、准丸径的偏差小。 因此,甲机器的生产性能比乙好。,最终,我们选用 来刻画随机变量X的取 值对均数EX的平均偏离程度(波动程度)。,1、方差定义,称为X的标准差。,方差反映了随机变量取值对均数的平均偏离程度。,(1)离散型,(2)连续型,其中 (i=1,2,),其中f(x)是X的概率密度函数,为了便于计算,可由定义式推出实用计算公式为,即,3、方差的性质,(1)D(C)=0(C为常数) (2) (k为常数) (3) (k、b为常数) (4) (X与Y独立,可推广到 任意有限个相互独立随机变量的情况),解 D(2X+3)=4DX=,由X的分布列得,则,而由例1知EX=,所以,三、变异系数标准差相对

17、于均数的变化率,变异系数用来比较两个均数相差很大或者量纲不同 的随机变量取值的波动程度。,例5 据调查,某地18岁男子身高均数为165.08cm, 标准差为4.98cm,体重均数为51.6kg,标准差为 5.01kg,试比较该地男子的身高和体重波动程度哪 个大?,解 因为身高和体重单位不同,直接用标准差比较 波动程度不合适,应用变异系数来比较,身高,体重,可见,体重的相对波动程度大于身高的相对波动 程度。,离散型变量的二项分布、泊松分布和连续型变量 的正态分布,是三种最基本也是最重要的分布,它 们之间有着密切的联系,即,当 时,二项分布以泊松分布为极限分布; 当 时,二项分布以正态分布为极限分

18、布; 当 时,泊松分布以正态分布为极限分布,以上第一种渐近分布在第一节中已经介绍过,这 里不再重复。以下介绍后两种渐近分布。,二项分布的正态近似,当 时,,有了二项分布的两个近似运算,现总结二项分布问题 中的计算方法的选择: (1)当n为一个较小的数,可直接用二项分布公式 (2)当n是一个大的数,p很小,np较小,则用泊松 分布近似计算; (3)当n是一个大的数,np较大时,则用正态分布 近似计算,例1 某车间送检一批针剂,其中次品的概率是0.01, 问抽检500支针剂,有5支次品的概率是多少?,解 设抽检的500支针剂中次品数为X,则XB(500,0.01),其中n很大,np=5较小, 因此

19、化为泊松分布P(5)近似计算,例2 对一癌症高发病地区进行普查,患病率为0.005, 现有这地区一万人的乡村,试求: (1)此乡有70人患癌症的概率; (2)有3050人患病的概率;,解 设一万人的乡村中患癌症的人数为X,则 XB(10000,0.005),此时n很大,但np=50较大, 故用正态分布来计算,(1),(2),当 时,,泊松分布的正态近似,例3 某药厂大批量生产外用药,平均每个月的废品数为35件,试估计下个月内出现废品数少于40件的概率。,解 设此药厂每月生产的废品数为X,出现废品属于伯 努利试验之稀有事件,则XP(35),可用正态分布 近似计算,则XN(35,35),所谓极限定

20、理,就是采用极限的方法得出随机变 量分布的一系列定理。一般可以分为两类: 第一类是阐述若干个随机变量的均数的极限定理, 统称为大数定律;第二类是阐述在怎样的条件下, 当n不断增大时,n个独立随机变量之和的极限分布 为正态分布,统称为中心极限定理。,1、切比雪夫不等式(Chebyshev),设随机变量X有期望EX和方差DX, 则对于 ,有,一、大数定律,或,切比雪夫不等式只用均数和方差就描述了随机变量 大概的概率分布情况,无需知道X的分布,因此它在 理论研究及实际应用中很有价值。,例1 某地区调查10000名某疾病患者,该病需住院 治疗的概率为0.7,试用切比雪夫不等式估计10000 名患者中同

21、时需要住院的人数在68007200之间 的概率。,解 设X表示同时住院的病人数,则XB(10000,0.7),若要精确计算,应用正态分布近似计算,即,XN(7000,2100),现用切比雪夫不等式来估计,EX=np=7000,DX=npq=2100,虽然有10000名患者,但只要预备7200张病床就能 以相当大的概率保证病床够用。,2、切比雪夫大数定律,设 , 是相互独立的随机变量 且 ,则对 有,这个定理表明,当n充分大时,独立随机变量 的算术平均数近似等于均数 的算术平均数。,推论 若 , 独立同分布, 且 , ,则对 ,有,上式说明,只要n足够大,样本平均值以很大的 概率接近于总体平均数

22、。这也应证了生活中常用的 “平均数原理”,我们测量一医学指标,在不变的条件 下,重复测量多次,最后取算术平均值作为真值的 近似值。,3、伯努利大数定律,设X是n次伯努利试验中事件A发生的次数, P(A)=p,则对 ,有,该定律证明了频率的稳定性。只要试验次数n足够大,事件A出现的频率f(A)就会稳定在p(A)附近。 因此,在统计实践中,经常用频率作为概率的估计 值。,二、中心极限定理,1、客观背景,观察表明,如果一个量是由大量相互独立的随机 因素的影响所造成,而单个因素在总影响中所起的 作用不大,则这种量一般都服从或近似服从正态分布.,设X1,X2, 是独立同分布的随机变量序列,且EXi= ,DXi= ,i=1,2,,则对任意实数x,有,2、中心极限定理,其中,例2 1片药片的重量是个随机变量,其均数为1g, 标准差为0.1g,求1瓶(100片)药片重量大于102g 的概率。,解 设药片重量为X,瓶中第i片药片的重量为 (i=1,2,100)且 相互独立,由中心极限定理结论中的第三个公式得,100片药片重量可表示为,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1