概率与概率分布.ppt

上传人:本田雅阁 文档编号:2490840 上传时间:2019-04-03 格式:PPT 页数:68 大小:1.22MB
返回 下载 相关 举报
概率与概率分布.ppt_第1页
第1页 / 共68页
概率与概率分布.ppt_第2页
第2页 / 共68页
概率与概率分布.ppt_第3页
第3页 / 共68页
亲,该文档总共68页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《概率与概率分布.ppt》由会员分享,可在线阅读,更多相关《概率与概率分布.ppt(68页珍藏版)》请在三一文库上搜索。

1、Chapter3 概率与概率分布,大数定律 二项分布 泊松分布 高斯分布 卡方(2)分布 t分布 和 f分布,内容:,第一节 概率基础知识 第二节 几种常见的理论分布 第三节 统计数的分布,有关概率的一些基本概念 事件、概率、频率 概率的计算 随机变量 定义 离散型随机变量概率分布 连续型随机变量概率分布 大数定理 随机变量的数学期望,第一节 概率基础知识,随机事件:某些确定条件下,可能出现也可能不出现的现象,也叫随机事件 概率P(A) :描述随机事件发生的可能性大小的数值。 P的大小在0和1之间,越接近于1,说明发生的可能性越大,越接近于0,说明发生的可能性越小。 频数:事件A在n次重复试验

2、中发生了m次,m就是事件A发生的频数。 频率W(A):事件A在n次重复试验中发生了m次,其比值m/n就是事件A发生的频率。当重复试验次数足够大的情况下,频率可以认为是概率。,一、有关概率的一些基本概念,(一)事 件 1. 必然事件(U) 2. 不可能事件(V) 3. 随机性事件 在相同条件下进行大量重复试验时,其试验结果却呈现出某种固有的特定的规律性频率的稳定性,通常称之为随机现象的统计规律性。,(二)概 率(probability),目的:了解各种随机事件发生的可能性大小,揭示这些事件的内在的统计规律性。 定义:能够刻划事件发生可能性大小的数量指标。 特性:事件本身所固有的,不随人的主观意志

3、而改变 记号:事件A的概率记为P(A),概率的性质 1)对于任何事件A,有0P(A)1; 2)必然事件的概率为1,即P(U)=1; 3)不可能事件的概率为0,即P(V)=0。,(三)小概率事件实际不可能性原理 随机事件的概率表示了随机事件在一次试验中出现的可能性大小。 若随机事件的概率很小,例如小于0.05、0.01、0.001,称之为小概率事件。,小概率事件虽然不是不可能事件,但在一次试验中出现的可能性很小,不出现的可能性很大 ,以至于实际上可以看成是不可能发生的。 在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理。 小概率事件实

4、际不可能性原理是统计学上进行假设检验(显著性检验)的基本依据。,二、概率的计算,事件的相互关系 和事件 积事件 互斥事件 对立事件 独立事件 完全事件系,互斥事件,对立事件,1、有一批种子,其中二级占5%,一级占10%,其余为三级,问三级种子占多少? 2、若一批玉米种子发芽率为0.9,发芽后能出土的概率为0.8,求这批种子的出苗率?,若要全面了解随机试验,则必须知道随机试验的全部可能结果及各种可能结果发生的概率,即必须知道随机试验的概率分布(probability distribution)。 为了深入研究随机试验 ,先引入随机变量(random variable)的概念。,三、概率分布,离散

5、型随机变量(discrete random variable) 表示试验结果的变量,其可能取值可罗列,且以各种确定的概率取这些不同的值 ; 连续型随机变量(continuous random variable) 表示试验结果的变量x,其可能取值为某范围内的任何数值,且x在其取值范围内的任一区间中取值时,其概率是确定的。,(一)离散型随机变量概率分布 函数表达形式: 表格表达形式:,离散型随机变量的概率分布具有下列性质:,(二)连续随机变量的概率密度,对于连续型随机变量x(-x+)如果存在非负可积函数f(x) ,对任意的x1,x2(x1x2)都有,则称f(x)为X的概率分布密度函数,简称概率密度

6、。,连续型随机变量概率分布的性质: 1、分布密度函数总是大于或等于0,即 f(x)0; 2、,(三) 分布函数 设X为随机变量,x为任意实数,称函数F(x)=P(Xx) 为X的累积分布函数。 离散型随机变量的分布函数为 连续型随机变量的分布函数为,大数定律概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。 贝努里大数定律:设m是n次重复独立试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则取任意小数0 有 意义:当试验次数n足够大时,有事件A发生的频率收敛于概率。,(四)大数定律,辛钦大数定律: 设独立随机变量序列X1, Xn,且具有相同的数学期望E(Xi)=, 则取任意

7、小数0 ,有即当n足够大时,随机变量序列的平均数收敛于数学期望。,意义:当n很大时,独立同分布的随机变量的平均值 依概率收敛于它的数学期望 。,切比雪夫大数定理,若X1, X2,Xn相互独立,每个Xk的方差存在,且一致有界, 即存在常数c,使得,令,则对任意正数 有,意义:当n 很大时,相互独立方差一致有界的随机 变量的平均值依概率收敛于它的数学期望。,大数定律一般形式:,若随机变量序列Xn满足:,则称Xn 服从大数定律.,(1) 伯努利大数定律是切比雪夫大数定律的特例.,注 意,(3) 切比雪夫大数定律是马尔可夫大数定律的特例.,(2) 伯努利大数定律是辛钦大数定律的特例.,(五)随机变量的

8、数学期望和方差 数学期望:随机变量所有可能取值的平均水平,记为E(X)或。 离散型随机变量 连续型随机变量的数学期望,其中 PX = xk = pk k=1, 2, 3, .,离散型随机变量,方差的计算,方差计算公式,连续型随机变量,第二节 几种常见的理论分布,二项分布 (Binomial distribution) 泊松分布 (Poissons distribution) 高斯分布 (Gauss distribution),随机变量的概率分布 (probability distribution),离散型变量 (discrete random variable),连续型变量 (continuo

9、us random variable),二项分布 泊松分布,正态分布,变 量,一、 二 项 分 布, 二项分布的概率的计算方法 二项分布的形状和参数,(一) 贝努利试验及其概率公式 将某随机试验重复进行n次,若各次试验结果互不影响 , 即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这n次试验是独立的。 对于n次独立的试验,如果每次试验结果出现且只出现对立事件A与之一, 在每次试验中出现A的概率是常数p(0p1),因而出现对立事件的概率是1-p=q,则 称 这一串重复的独立试验为n重贝努利试验,简称贝努利试验(Bernoulli trials )。,在n重贝努利试验中,事件 A 可能

10、发生0,1,2,n次,现在我们来求事件 A 恰好发生k(0kn)次的概率Pn(k)。 先取n=4,k=2来讨论。在4次试验中,事件A发生2次的方式有以下 种:,由于试验是独立的,按概率的乘法法则,于是每种出现的概率有:,又由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,在4 次试验中,事件A恰好发生2次的概率为:,P4(2) = P( ) + P( ) + + P( )=,P( )=P( )= P( ) = P( )P( )P( )P( )=,若把上式与二项展开式 相比较就可以发现,在n重贝努利试验中,事件A发生k次的概率恰好等于 展开式中的第k+1项,所以称作二项概率公式

11、。,因此,在n重贝努利试验中,事件A恰好发生(0kn)次的概率为: k=0,1,2,n,二项分布:在n重贝努里试验中,“成功”(事件A发生)的次数x是一个随机变量,其概率分布为 其中n,p为参数,记为,二项分布的累计函数:,由于(p+q)n=1,所以,性质,二项分布的数学期望 E(x)=np 方差 D(x)=npq 标准差,例如:某种昆虫在某地区的死亡率为40%,即p=0.4,现对这种害虫用一种新药进行治疗试验,每次抽样10头为一组治疗。试问如新药无疗效,则在10头中死3头、2头、1头以及全部愈好的概率为多少? 按照上面的公式进行计算 7头愈好,3头死去的概率为: 8头愈好,2头死去的概率为:

12、 9头愈好,1头死去的概率为: 10头全部愈好的概率为:,P32 例3.6,Fig. 1 Scatter plot of G + C content against chromosome length for 640 fully sequenced bacterial chromosome. In the figure, each point corresponds to a bacterial chromosome. The red circles denote obligate pathogens or obligate symbionts.,(二) 二项式分布的形状和参数,对于一个二项式

13、总体: 1. 若p=q,二项式分布呈对称形状。 2. 若pq,n较小,二项式分布则表现偏斜形状。 3. 若n时,即使pq,二项式总体分布的情况也趋于对称形状。 所以二项分布的形状是由n和p两个参数决定的。 如果n相当大或p与q基本接近,二项式分布接近于正态分布,二项分布的图形,二项分布的应用条件: (1)各观察单位 只具有互相对立 的两种结果,如阳性或阴性,生存或死亡等,属于二项分类资料; (2)已知发生某一结果 (如死亡) 的概率为p,其对立结果的概率则为1-p=q,实际中要求p 是从大量观察中获得的比较稳定的数值; (3)n个观察单位的观察结果互相独立,即每个观察单位的观察结果不会影响到其

14、它观察单位的观察结果。,多项式分布,超几何分布,产品抽样检查中经常遇到一类实际问题,假定在N件产品中有m件不合格品,即不合格率p=m/N。在产品中随机抽n件做检查,发现 k 件是不合格品,可知得到 k 的概率为,二、泊松分布(Poisson distribution),罕见事件发生数的分布规律,盒子中装有999个黑棋子,一个白棋子,在一次抽样中,抽中白棋子的概率1/1000。那么在100次放回抽样中,抽中1,2,10个白棋子的概率分别是? 2. 放射性物质单位时间内的放射次数 3. 单位体积内粉尘的计数 4. 血细胞或微生物在显微镜下的计数 5. 单位面积内细菌计数 6. 人群中患病率很低的非

15、传染性疾病的患病数,概率分布: 若随机离散变量x只取零和正整数值0,1,2,且其概率分布为 并且 其中=np0; x=0,1,, e=2.7182 是自然对数的底数,则 称 x 服 从 参 数 为 的 泊 松分布(Poissons distribution),记 为 xP()。,泊松分布重要的特征: 1. 平均数和方差相等,都等于常数,即=2=,2. 值愈小分布愈偏倚; 3. 随着的增大,分 布趋于对称。当= 20时分布接近于正态分布;当=50时,可以认为泊松分布呈正态分布。 当20时就可以用正态分布来近似地处理泊松分布的问题。,Poisson分布的可加性,观察某一现象的发生数时,如果它呈Po

16、isson分布,那么把若干个小单位合并为一个大单位后,其总计数亦呈Poisson分布。 若X1P(1), X2P(2), XKP(k) ,那么 X=X1+ X2+ +XK , 则: XP(),【例】 为监测饮用水的污染情况, 现检验某社区每毫升饮用水中细菌数 , 共得400个记录如下: 试分析饮用水中细菌数的分布是否服从泊松分布。 若服从,按泊松分布计算每毫升水中细菌数的概率及理论次数并将频率分布与泊松分布作直观比较。,以 =0.500代替公式中的,得 (k=0,1,2),经计算得每毫升水中平均细菌数 =0.500,方差S2=0.496。两者很接近, 故可认为每毫升水中细菌数服从泊松分布。,可

17、见细菌数的频率分布与=0.5的泊松分布是相当吻合的 , 进一步说明用泊松分布描述单位容积(或面积)中细菌数的分布是适宜的。,注意:泊松分布的应用条件要求n 次试验是相互独立的。 P35 例3.8,离散型概率分布: 均匀 伯努利 几何 二项 泊松 超几何 多项 负二项 玻尔兹曼 复合泊松 退化 高斯-库兹明 对数 拉德马赫 Skellam Yule-Simon 齐夫 齐夫-曼德尔布罗特 抛物线分形,三、正态分布,一种连续型随机变量的概率分布:,则称x服从参数为(-0) 的正态分布,记为x N(, 2)。,(一) 正态分布曲线的特性,1、它是一条对称分布的曲线,且对称轴为x=,即以平均数为对称轴。

18、 2、正态分布曲线的算术平均数、中值、众数三者是相等的,都合于点上。且多数次数分布在平均数附近。 3、随着 和 的不同,呈现一系列曲线而并不是一条曲线。确定它在x轴上的位置,确定它的变异度。不同 和 的总体具有不同的曲线位置和变异度,所以任何一个正态分布曲线,必须在确定了 和 后,才能确定曲线位置和形状。,4、正态分布曲线在x-=1 处有拐点,曲线两尾 向左右延伸,永不接触,所以x时,分布 曲线以x轴为渐近线。 5、正态分布曲线与x轴之间的总面积等于1。 6、正态曲线的任何两个x的定值间的面积或概率 完全以曲线 和 而确定。,下面为几对常见的区间与其相对应的面积或概率的数字:,区间 面积或概率

19、 1 0.6827 2 0.9545 3 0.9973 1.960 0.9500 2.576 0.9900,(二)标准正态分布,当正态分布=0且=1时,则称x服从标准正态分布,用f(u)(x=u)表示概率密度函数,即,标准化:若x N(, 2),则可以将其标准化,标准正态分布累积函数F(u):,当aub时:,P38 例3.9、例3.10、例3.11,Poisson分布与正态分布及二项分布的关系,当较小时, Poisson分布呈偏态分布,随着增大,迅速接近正态分布,当 =20时,可以认为近似正态分布。 Poisson分布是二项分布的特例,某现象的发生率p很小,而样本例数n很大时,则二项分布接近于Poisson分布。 np(应用: Poisson替代二项分布),泊松分布,正态分布,相当大,二项分布,n相当大或 p与q基本接近,p很小,n很大,其它重要分布函数,对数正态分布,伽玛(Gamma)分布,称为伽玛函数,如果为正整数,则伽玛函数定义为: () = ( 1)!,称为形状参数(shape parameter) 称为尺度参数(scale parameter),贝塔(Beta)分布,称为贝塔函数,韦伯分布 瑞利分布 极值分布 负指数分布 幂律分布 麦克斯韦-波尔兹曼分布 费米-狄拉克分布,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1