概率论基础第二章条件概率与统计独立性.ppt

上传人:本田雅阁 文档编号:2135120 上传时间:2019-02-20 格式:PPT 页数:169 大小:6.37MB
返回 下载 相关 举报
概率论基础第二章条件概率与统计独立性.ppt_第1页
第1页 / 共169页
概率论基础第二章条件概率与统计独立性.ppt_第2页
第2页 / 共169页
概率论基础第二章条件概率与统计独立性.ppt_第3页
第3页 / 共169页
亲,该文档总共169页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《概率论基础第二章条件概率与统计独立性.ppt》由会员分享,可在线阅读,更多相关《概率论基础第二章条件概率与统计独立性.ppt(169页珍藏版)》请在三一文库上搜索。

1、第二章 条件概率与统计独立性,萨特,法国思想家、作家, 存在主义哲学的大师: “ Hell is other people ” 他人即地狱 对“我”来说,其他的人就像一个贼,要将“我”的世界偷去,将我纳入他们的轨道中,成为一个“在己存有”(being-in-itself ),成为一个对象或东西。,What should I do? Should I be who you want me to be? Just do it!,在解决许多概率问题时,往往需要在有某些附加信息(条件)下求事件的概率.,一、 条件概率的概念,如在事件B发生的条件下求事件A发生的概率,将此概率记作P(A|B).,一般地

2、P(A|B) P(A),1. 条件概率, 全概率公式,贝叶斯公式,P(A )=1/6,,例如,掷一颗均匀骰子,A=掷出2点,,B=掷出偶数点,,P(A|B)=?,已知事件B发生,此时试验所有可能结果构成的集合就是B,,P(A|B)= 1/3.,B中共有3个元素,它们的出现是等可能的,其中只有1个在集A中.,容易看到,P(A|B),于是,P(A )=3/10,,又如,10件产品中有7件正品,3件次品,7件正品中有3件一等品,4件二等品. 现从这10件中任取一件,记,B=取到正品,A=取到一等品,,P(A|B),则,P(A)=3/10,,B=取到正品,P(A|B)=3/7,本例中,计算P(A)时,

3、依据的前提条件是10件产品中一等品的比例.,A=取到一等品,,计算P(A|B)时,这个前提条件未变,只是加上“事件B已发生”这个新的条件.,这好象给了我们一个“情报”,使我们得以在某个缩小了的范围内来考虑问题.,条件概率的直观定义 某个事件发生的可能性大小经常会受到另一相关事件发生与否的影响. 若在事件 已发生的条件下,事件 发生的概率为 则称 为在已知 发生的条件下, 发生的条件概率,记为,Example,考虑美国东部某大城市警察局男性与女性警官的升职情况.警察局有1200名警官,男性960人,女性240人. 在过去两年中有324名警官得到提升,男性288人,女性36人. 在浏览了升职记录后

4、,一个由女性警官组成的委员会指出在升职过程中存在性别歧视. 其依据是升职人数男性与女性比为288:36;而警察局官员否认歧视,认为男性升职多只是因为警官中男性本来就比女性多很多. 经过计算,男性警官升职概率为0.30,女性警官升职概率为0.15. 条件概率的使用本身不能表明歧视的存在,但条件概率的数值则成为女警官们指控的有力证据!,1. 在古典概型中,讨论 时,样本空间已缩小为“包含 的所有事件”,故,2. 同样,在几何概型中,若事件B已发生, 则为使 A也发生 , 试验结果必须是既在 B 中又在A中的样本点 , 即此点必属于AB. 由于我们已经知道B已发生, 故B变成了新的样本空间 , 于是

5、 有(1).,设A、B是两个事件,且P(B)0,则称 (1),定义2.1.1(conditional probability),为在事件B发生的条件下,事件A的条件概率.,条件概率的性质,譬如,2)从加入条件后改变了的情况去算,条件概率的计算,1) 用定义计算:,P(B)0,P(A|B)=,B发生后的缩减 样本空间所含样 本点总数,在缩减样本空 间中A所含样 本点个数,Sample space,Reduced sample space given event B,条件概率 P(A|B)的样本空间,例 甲、乙两厂共同生产1000个零件,其中 300件是乙厂生产的. 而在这300个零件中,有189

6、个是标准件,现从这1000个零件中任取一个,问这个零件是乙厂生产的标准件的概率是多少?,所求为P(AB).,甲、乙共生产 1000 个,189个是 标准件,300个 乙厂生产,设B=零件是乙厂生产,A=是标准件,所求为P(AB) .,设B=零件是乙厂生产,A=是标准件,若改为“发现它是 乙厂生产的,问它 是标准件的概率 是多少?”,求的是 P(A|B) .,B发生, 在P(AB)中作为结果; 在P(A|B)中作为条件.,例 人寿保险公司常常需要知道存活到某一个年龄段的人在下一年仍然存活的概率。根据统计资料可知,某城市的人由出生活到50岁的概率为0.90718,存活到51岁的概率为0.90135

7、。问现在已经50岁的人,能够活到51岁的概率是多少?,解,记,因此,要求,显然,因为,从而,可知该城市的人在50岁到51岁之间死亡的概率约为0.00643。在平均意义下,该年龄段中每千个人中间约有6.43人死亡。,由条件概率的定义:,即 若P(B)0,则P(AB)=P(B)P(A|B) (2),而 P(AB)=P(BA),乘法公式,若已知P(B), P(A|B)时, 可以反求P(AB).,将A、B的位置对调,有,故 P(A)0 , 则 P(AB)=P(A)P(B|A) (3),若 P(A)0,则P(BA)=P(A)P(B|A),(2)和(3)式都称为乘法公式, 利用 它们可计算两个事件同时发生

8、的概率,乘法公式应用举例,一个罐子中包含 b 个白球和 r 个红球. 随机地抽取一个球,观看颜色后放回罐中,并且再加进 c 个与所抽出的球具有相同颜色的球. 这种手续进行四次,试求第一、二次取到白球且第三、四次取到红球的概率.,波里亚(Plya)罐子模型,于是W1W2R3R4表示事件“连续取四个球,第一、第二个是白球,第三、四个是红球. ”,随机取一个球,观看颜色后放回罐中,并且再加进 c 个与所抽出的球具有相同颜色的球.,解 设 Wi=第i次取出是白球, i=1,2,3,4,Rj=第j次取出是红球, j=1,2,3,4,用乘法公式容易求出,当 c 0 时,由于每次取出球后会增加下一次也取到同

9、色球的概率. 这是一个传染病模型. 每次发现一个传染病患者,都会增加再传染的概率.,=P(W1)P(W2|W1)P(R3|W1W2)P(R4|W1W2R3),P(W1W2R3R4),样本空间的分割,二、全概率公式,图示,证明,化整为零 各个击破,某一事件 B 的发生有各种可能的原因 ,如果 B是由原因 Ai (i=1,2,n) 所引起,则 B 发生的概率是,每一原因都可能导致 B 发生,故 B 发生的概率是各原因引起 B 发生概率的总和,即全概率公式.,P (BAi) = P(Ai) P(B |Ai),全概率公式.,我们还可以从另一个角度去理解,由此可以形象地把全概率公式看成为“由原因推结果”

10、,每个原因对结果的发生有一定的“作用”,即结果发生的可能性与各种原因的“作用”大小有关. 全概率公式表达了它们之间的关系.,诸 Ai 是原因 B 是结果,例 有一批同一型号的产品,已知其中由一厂生产的占 30% , 二厂生产的占 50% , 三厂生产的占 20%, 又知这三个厂的产品次品率分别为2% , 1%, 1%,问从这批产品中任取一件是次品的概率是多少?,设事件 A 为“任取一件为次品”,解,由全概率公式得,30%,20%,50%,2%,1%,1%,称此为贝叶斯公式.,三、贝叶斯公式,贝叶斯资料,证明,证毕,贝叶斯公式在实际中有很多应用.,它可以帮助人们确定某结果(事件 B)发生的最可能

11、原因.,全概率公式,贝叶斯公式,若干原因,结果,如果把随机事件 B 看成是结果,随机事件组 A1,An 看成可能导致结果 B 发生的若干原因,,贝叶斯公式在决策理论中有重要应用: 不断地根据新得到的信息来修正原来的观点。,例 某一地区患有癌症的人占0.005,患者对一种试验反应是阳性的概率为0.95,正常人对这种试验反应是阳性的概率为0.04,现抽查了一个人,试验反应是阳性,问此人是癌症患者的概率有多大?,则 表示“抽查的人不患癌症”.,已知 P(C)=0.005, P( )=0.995, P(A|C)=0.95, P(A| )=0.04,求解如下:,设 C=抽查的人患有癌症, A=试验结果是

12、阳性,,求 P(C|A).,现在来分析一下结果的意义.,由贝叶斯公式,可得,代入数据计算得 P(CA)= 0.1066,2. 检出阳性是否一定患有癌症?,1. 这种试验对于诊断一个人是否患有癌症有无意义?,如果不做试验,抽查一人,他是患者的概率,患者阳性反应的概率是0.95,若试验后得阳性反应 则根据试验得来的信息,此人是患者的概率为,从0.005增加到0.1066,将近增加约21倍.,1. 这种试验对于诊断一个人是否患有癌症有意义.,P(CA)= 0.1066,P(C)=0.005,试验结果为阳性 , 此人确患癌症的概率为 P(CA)=0.1066,2. 即使你检出阳性,尚可不必过早下结论你

13、有癌症,这种可能性只有10.66% (平均来说,1000个人中大约只有107人确患癌症),此时医生常要通过再试验来确认.,PET/CT是当今最高端的医学影像诊断设备,能为确定和查找肿瘤及其他病灶的精确位置定量、定性诊断提供依据。PET/CT检查费用昂贵,动辄上万元一次 。(广州日报,2012-04-15) 一项研究指出,在用PET/CT对50岁59岁的健康日本人进行体检时发现,其阳性预测值仅有3.3%。也就是说,经PET/CT体检发现有肿瘤异常的患者中,近97%都不是真正的恶性肿瘤患者。(亚太肿瘤预防杂志, 2007),Example in Practice,P(Ai) (i=1,2,n) 是

14、在没有进一步信息(不知道事件B是否发生)的情况下,人们对诸事件发生可能性大小的认识.,当有了新的信息(知道B发生),人们对诸事件发 生可能性大小P(Ai | B)有了新的估计.,贝叶斯公式从数量上刻划了这种变化,在贝叶斯公式中,P(Ai)和P(Ai |B)分别称为原因的先验概率和后验概率.,Example 甲、乙、丙三囚犯,国王宣布以抽签决定释放一位,处决另两位。 他告诉狱卒那一位将被释放,但要求狱卒不可先透露。 甲请狱卒透露那一位被释放遭拒后,改问狱卒: 乙及丙中,那一位会被处决? 狱卒经一番思考,遂(诚实地)告诉甲: 乙会遭处决。,他认为这样做并未违反国王规定: 乙、丙二人,至少有一会遭处

15、决,这是大家都知道的,因此他并未提供甲任何有关甲会被释放的有用信息。 甲听到狱卒说乙会被处决后很高兴。原先他有1/3的机率遭释放,现在因只剩他与丙了,所以机率提高至1/2。 狱卒与甲的分析,何者正确?,解. 令A,B,C分别表甲、乙、丙三人会被释放的事件。 K表狱卒说乙会被处决的事件。 样本空间 =ABC。 由假设 P(A)=P(B)=P(C)=1/3。 想求P(A|K)。,若丙偷听到狱卒与甲的对话,则知他会被释放的机率提高至2/3。 若乙偷听到狱卒与甲的对话,则知他没有活命机会。 乙、丙二人中,有一人被释放之机率为2/3,若给定乙被处决,则丙便独自拥有全部被释放之机率2/3。,狱卒所提供的信

16、息是否无用?,至于甲,被释放之机率不会改变,还是1/3。 而三人被释放之条件机率和: P(A|K)+P(B|K)+P(C|K) = 1/3+0+2/3 = 1。,此例有时候以不同的型式出现,如汽车与山羊问题(Car-Goat Problem)。 在电影斗智21点(21)中曾出现。,三羊问题,斗智21点的一个场景: 参加一个游戏,有三扇门。 一门后有一辆车,另两门后有羊,主持人让你随意挑。 当你选择了一扇门后,主持人随后打开了其余两扇门中一扇有羊的门。 此时问你是否换到剩下的一扇门? 是否换?为什么?概率多少?,主人公选择:换!,选择正确!换的话得到车的概率是2/3.,2008年美国总统大选,9

17、月4日,美国共和党的全国代表大会上,阿拉斯加州长佩林(Sarah Palin) ,被提名为共和党的副总统候选人。 原先共和党总统候选人麦凯恩(John McCain)的民意支持度,落后民主党的总统候选人奥巴马(Barack Obama)。 提名佩林后,麦凯恩人气迅速窜升,声势立涨,在几份民调中,均胜过奥巴马。,维吉尼亚大学政治学者萨巴托(Larry Sabato),根据1960年以来的分析,指出全代会后民调结果与大选结果相符者,只有一半: 跟丢铜板预测差不多 You could flip a coin and be about as predictive.,对共和党而言,是否全代会后随即做的民

18、调,不论领先或落后,于当年11月的总统大选,其提名人当选或落选之机率相同? 民调无用?只需丢铜板?,依萨巴托的分析,设 P(当选|领先)=P(落选|领先)=1/2,(*) 其中 领先表两党已决定正副总统候选人后,对两组候选人所立即做的民调,共和党领先; 当选表在当年总统大选时,共和党获胜。,P(当选|落后)=P(落选|落后)?(*) 若成立,则全代会后的民调领先或落后,共和党便可不必在意。甚至此民调根本就是多余的。,令 P(当选|落后) =a, P(落选|落后)=1-a。 由(*)并无法决定a。再令 P(当选)=r,P(领先)=s。 P(当选) =P(当选|领先)P(领先) +P(当选|落后)

19、P(落后)。,r = s = 1/2 a = 1/2 (*)成立。 r = 0.48,s = 0.5 a = 0.46 1/2 。 a值乃与r及s有关!,Example,小汽车油耗小,但不如大汽车安全. 小汽车事故中死亡率为0.128,大汽车事故中死亡率为0.05. 某城市小汽车的市场占有率为18%. 1.请问该市事故中的死亡率是多少?(假定事故发生与车型无关),2.若某次事故中有死亡发生,请问该事故由小汽车引起的概率是多少?,Thomas Bayes,Born: 1702 in London, England Died: 17 April 1761 in Tunbridge Wells, K

20、ent, England,概率论理论创立人,如果你使用过Google, 你就已经从贝叶斯的理论中收益了。,搜索巨人 Google 和 Autonomy (一家出售信息恢复工具的公司),都使用了Bayesian principles 为数据搜索提供近似的.研究人员还使用贝叶斯模型来判断症状和疾病之间的相互关系, 开发能够根据数据和经验来决定行动的人工智能设备, 创建个人机器人. 值得一提的是,后来的学者还依据贝叶斯公式的思想发展了一整套统计推断方法,叫作“贝叶斯统计”. 可见贝叶斯公式的影响.,Thomas Bayes,一位伟大的数学大师, 1702年出生于伦敦, 后来成为了一名Presbyte

21、rian minister. 和他的同事们不同:他认为上帝的存在可以通过方程式证明,虽然他看到了自己的两篇论文被发表了, 但是Essay Toward Solving a Problem in the Doctrine of Chances却一直到他死后的第三年(1764年)才被发表. 他的理论很有效, 照亮了今天的计算领域, 研究者正在把对这种思想的应用从基因研究推广到fillering email的研究.,显然 P(A|B)=P(A),这就是说,已知事件B发生,并不影响事件A发生的概率,这时称事件A、B独立.,2. 事件独立性,A=第二次掷出6点, B=第一次掷出6点,,先看一个例子:,将

22、一颗均匀骰子连掷两次,,设,一、两个事件的独立性,由乘法公式知,当事件A、B独立时,有 P(AB)=P(A) P(B),用P(AB)=P(A) P(B)刻划独立性,比用 P(A|B) = P(A) 或 P(B|A) = P(B) 更好,它不受 P(B)0 或 P(A)0 的制约.,若两事件A、B满足 P(AB)= P(A) P(B) (1) 则称A、B是统计独立的,简称A、B独立.,两事件独立(independent)的定义,例1 从一副不含大小王的扑克牌中任取一张,记 A=抽到K, B=抽到的牌是黑色的,可见, P(AB)=P(A)P(B),由于 P(A)=4/52=1/13,故 事件A、B

23、独立.,问事件A、B是否独立?,解,P(AB)=2/52=1/26.,P(B)=26/52=1/2,前面我们是根据两事件独立的定义作出结论的,也可以通过计算条件概率去做:,从一副不含大小王的扑克牌中任取一张,记 A=抽到K, B=抽到的牌是黑色的,在实际应用中, 往往根据问题的实际意义去判断两事件是否独立.,可见 P(A)= P(A|B), 即事件A、B独立.,则,P(A)=1/13, P(A|B)=2/26=1/13,在实际应用中,往往根据问题的实际意义去判断两事件是否独立.,由于“甲命中”并不影响“乙命中”的概率,故认为A、B独立 .,甲、乙两人向同一目标射击,记 A=甲命中, B=乙命中

24、,A与B是否独立?,例如,(即一事件发生与否并不影响另一事件发生的概率),一批产品共n件,从中抽取2件,设 Ai=第i件是合格品 i=1,2,若抽取是有放回的, 则A1与A2独立.,因为第二次抽取的结果受到第一次 抽取的影响.,又如:,因为第二次抽取的结果 不受第一次抽取的影响.,若抽取是无放回的,则A1与A2不独立.,若事件A与B相互独立, 则以下三对事件,也相互独立.,证,注 称此为二事件的独立性 关于逆运算封闭.,性质,且A与B相互独立,二、多个事件的独立性,四个等式同时成立,则称事件A、B、C相互独立.,两两独立,相互独立,?,例如,考虑一个古典概型,样本空间,性质,3. 称无穷多个事

25、件相互独立,如果其中任意有限多个事件都相互独立。,三、事件独立性与概率的计算,设 相互独立,则,(1)将其中任意 个事件改为相应的对立事件,形成新的 个事件仍然相互独立.,(2),在可靠性理论中的应用,对于一个元件,它能正常工作的概率r,称为它的可靠性。元件组成系统,系统正常工作的概率称为该系统的可靠性。,并联系统,并联系统在所有 n 个元件同时失灵时,系统才失灵. 系统可靠性为 n 越大,系统越可靠,成本越高.,例 一个大学毕业生给四家单位各发出一份求职信,假定这些单位彼此独立,通知他去面试的概率分别是 1/2,1/3,1/4,1/5。这个学生至少有一次面试机会的概率是多大?,【解】 考虑对

26、立事件,一次面试机会都没有 的概率是 1/22/33/44/5 = 1/5, 所以至少有一次面试的概率是 4/5。,有志者,事竟成,一般认为发生概率 0.05 的一个,随机事件就可以称为是小概率事件。,假如只做一次试验,那么一个小概率事件,在这次试验里是不应该发生的。,如果不停重复试验,只要它不是不可能 事件,最终这个事件都会必然发生。,串联系统,链条定律:一根链条的强度,取决于它最薄弱的一环的强度. 链条越长,就越薄弱. 串联系统在所有 n 个元件同时有效时,系统才有效. 系统可靠性为 n 越大,系统越不可靠;成本低.,例 (概率与伴侣) 下面是某位男士所列的,22 27 岁 1/4,受过良

27、好教育 1/5 漂亮 1/5 聪明 1/4 性格温柔、体贴 1/6 中等身高体重 1/2 身体健康 1/2 有共同爱好 1/8 未婚 1/2 喜欢他 1/5,假定这些条件 都彼此相互独立, 所有概率的乘积 1/41/5 = 1/768,000,如果要全部满足条件,假定每天认识 两位女性,他平均需要等待 1000 年时间。 ,他的女友应该满足的条件,例 下面是一个串并联电路示意图. A、B、C、D、E、F、G、H 都是电路中的元件. 它们下方的数是它们各自正常工作的概率. 求电路正常工作的概率.,解 将电路正常工作记为W,由于各元件独立工作,有,其中,P(W) 0.782,代入得,例 三人独立地

28、去破译一份密码,已知各人能译出的概率分别为1/5,1/3,1/4,问三人中至少有一人能将密码译出的概率是多少?,解 将三人编号为1,2,3,,所求为,记 Ai=第i个人破译出密码 i=1 , 2 , 3,已知, P(A1)=1/5 , P(A2)=1/3 , P(A3)=1/4,1,2,=1-1-P(A1)1-P(A2)1-P(A3),3,四、试验的独立性,试验序列 多个或无穷个试验构成的序列.,独立试验序列 每个试验结果相互独立的试验序列.,所谓试验相互独立,就是其中一试验所得到的结果,对其它各试验取得其可能结果的概率都没有影响。,先考虑两个随机试验,假定对于 , 表示第 个试验的概率空间.

29、按照我们对独立性的理解,两个试验的独立性应当叙述为:,但是这一命题至少有两点不妥。首先,“ 与 同时发生”应当是两个事件的交,但它们分别是两个样本空间的子集合,无法进行运算。 其次,两个概率空间有各自的概率 与 ,但此时涉及两个试验,故命题中“同时发生的概率”即不能用 也不能用 来度量。,(*),对任何 , , 与 同时发生的概率等于它们各自概率之乘积。,取样本空间,可见,要严格刻画两试验的独立性,必须适当地构造一个同时描述这两个试验的新的概率空间,对任何 , ,定义它们的Descartes乘积,若,的子集合称为可测矩形。,中形如,可测矩形的全体记为,然后取 生成的 代数为 与 的Descar

30、tes乘积。,即事件域取为,最后,对于每个可测矩形,取,(1),可以证明, 上的这个集函数 可唯一地扩张为 上的概率测度,称为 与 的乘积测度,记为,至此,我们已经建立了乘积测度空间,其中,形如 的可测矩形由这样的样本点 组成: 限定在 中,而 在 中任取。于是它代表“第一个试验出现结果 ”这种只涉及第一个试验的事件。,同理,形如 的可测矩形代表“第二个试验出现结果 ”这种只涉及第二个试验的事件。,由(1)式可知:,(2),也就是说上述只涉及一个试验的事件仍保持其在原概率空间中的概率值。而用乘积测度来度量两者同时发生的概率时,根据(1)和(2)式可得:,(3),这正是前面的命题(*)的严格数学

31、表达。可见将它们放进乘积概率空间之后,前面对命题(*)提出的两点不妥均不复存在。,也就是说试验是否具有独立性取决于乘积空间上概率测度的选择。,至此我们可以说,两个试验 是否相互独立,就是要看乘积样本空间 上的概率是否取作由(1)式确定的乘积测度.,例 从r个红球和b个白球中有放回的任取两球。,用一个概率空间来描述这个试验。,从而,,从而,另一方面, ,于是我们得到,因而事件 与 独立。,(4),而对 i =1,2,用 Ai 表示“第 i 个球是红球”这一事件. 则,现将两次取球分开看作两个试验,,其中含有 个等可能的样本点,这样就构造出两个试验各自的概率空间为,而(4)式表明,前面那个描述两次

32、取球的概率空间,正是这两个概率空间的Descartes乘积。,也就是说,对有放回取球情形,两次取球(试验)是相互独立的。,对 取,故,Question 乘积空间上的测度是否就只能是乘积测度,就像算术中矩形面积等于长乘宽一样自然?,例如,在上面的例3中,如果改为“无放回取球”。,我们仍然可以用乘积样本空间 表示两次取球的结果,但是其中的 样本点不再是等可能的了。例如,使 的样本点是不可能出现的。,因为,所以,在描述两次不放回取球的概率空间中,概率 已不再是乘积测度,故两次取球试验不独立。,不然。正如对于欧氏空间中的图形,除了面积与长度(Legesgue测度)之外,尚有许多其它的度量。,最后我们给

33、出 个试验相互独立的一般定义。,定义,设有 个随机试验, 第 个随机试验的概率空间为,代表这 个试验的乘积样本空间,如果 上的概率测度 是 的乘积测度,即对任何 满足:,则称这 个试验相互独立。,如果再设 即n个试验有相同的概率空间,则称它们为n重独立重复试验。,看一个试验 将一枚均匀骰子抛掷3次.,X的分布律是:,令X 表示3次中出现“4”点的次数,3. 伯努利试验与直线上的随机游动,掷骰子:“掷出4点”,“未掷出4点”,抽验产品:“是正品”,“是次品”,一般地,设在一次试验 E 中我们只考虑两个互逆的 结果:A 或 .,这样的试验 E 称为伯努利(Bernoulli)试验 .,“重复”是指

34、这 n 次试验中P(A)= p 保持不变.,将伯努利试验E独立地重复地进行n次,则称这一串重复的独立试验为n重伯努利试验 .,“独立”是指各次试验的结果互不影响 .,一、伯努利概型,只有两个可能结果的试验称为伯努利试验。重复进行n次独立的伯努利试验,称为n重伯努利试验。记为,n重伯努利试验有下面的四个约定:,(ii)A在每次试验中出现的概率P 保持不变;,(iii)各次试验相互独立;,(iv)共进行了n次试验。,(i)每次试验至多出现两个可能结果之一: 或 ;,的样本空间为:,其中 是 或 ,分别表示第 次试验中出现 或 。,伯努利资料,样本空间的所有子集为事件域 。,可列重伯努利试验(E )

35、 : 样本点w = (w1,w2, ,wn, ) 样本点的个数不再可列,可列重伯努利试验,根据试验的独立性,就能给出所有,样本点及所有事件的概率。,伯努利试验是一种非常重要的概率模型,它是“在同样条件下进行重复试验”的一种数学模型,特别在讨论某事件出现的频率时常用这种模型。,在历史上,伯努利概型是概率论中最早研究的模型之一,也是得到最多研究的模型之一,在理论上具有重要的意义。,另一方面,它有着广泛的应用,在我们这门课程中,一些较为深入的结果也是结合伯努利概型进行讨论的。,二、伯努利概型中的一些分布,下面我们计算伯努利概型中所出现的一些事件的概率,这些概率非常重要。,1、伯努利分布,只进行一次伯

36、努利试验,则或是事件 出现,或是事件 出现,其概率由下式给出:,称为伯努利分布。,2、二项分布,n重伯努利试验中事件 出现 k 次的概率。,二项分布的图形,根据谷歌公布的全球TOP1000网站榜单,2010年9月,腾讯QQ.com网站排名第九,日独立用户数1.3亿,用户到达率为8.4%,http:/ 2010年10月29日,第二大客户端软件360针对QQ提出“扣扣保镖”产品,提供过滤QQ迷你首页广告功能,一定程度上影响了腾讯的收入。,Example in Practice,假定弹窗为带来了25%的流量。 随机抽取20个的独立用户,求: 1.恰好有12个用户是从qq弹窗链接进来的概率; 2.不超

37、过5个用户是从qq弹窗链接进来的概率.,3、几何分布,可列次伯努利试验中首次成功出现在第k次试验的概率,为几何级数的一般项,称为几何分布。,几何分布给出了等待事件A出现共等了k次的概率,这类概率在许多问题中出现。,4、巴斯卡分布,可列次伯努利试验中第r次成功出现在第k次试验的概率,巴斯卡分布与著名的分赌注问题有关。 大意如下:,甲、乙两个赌徒按某种方式下注赌博,说定先胜 t 局者将赢得赌注,但进行到甲胜 r 局,乙胜 s 局(r t,s t)时因故不得不中止,试问如何分配这些赌注才会合理?,若用已胜局数作比例分配赌注,即用r:s来分配,不太合理,因为这种分法没有考虑到最终取胜的概率。,在伯努利

38、试验中,求在出现 次 之前出现 次 的概率。,若以 及 分别记甲、乙为达到最后胜利所须再胜的局数,又设甲在每局中取胜的概率为 ,我们便可以把分赌注问题归结为如下概率问题:,若以P甲记上述概率,则它为甲最终取胜的概率,那么赌注以 P甲:1 P甲分配才是公平合理的。巴斯卡和费马在某种程度上都达到这个结果。,【解法】 第n个A出现在第n+k次试验, 0k m-1,P甲,P甲,可以证明上述三个答案是一致的。,另外,容易证明,再赌 局一定可以分出胜负。因此甲为取得最终胜利只须而且必须在后继的 局中至少胜 局。这样利用二项分布可知:,【解法2】 第m个A出现在第m+k次试验, kn,P甲,【解法3】,例4

39、 巴拿赫火柴盒问题,数学家的左、右衣袋中各自放有一盒装有N根火柴的火柴盒,每次抽烟时任取一盒用一根,求发现一盒用光时,另一盒还有 r 根的概率。,解,看作 的伯努利试验。要左边空而右边剩r根,,应该是左边摸过 次,而右边 ,它的概率为:,对于右边先空的情况可同样考虑,因此所求的概率为,发生在岐关车上的一段对话,媽咪, 你點解“磨爛席”咁蠢架, 梗系輸到渣都無啦!,麥兜, 尋晚我真喺黑過墨斗, 響賭場賭咗成晚, 輸咗成萬文,渣都無埋!,发生在岐关车上的一段对话,你應該學我咁, 將啲錢分三份, 只賭三次, 無論輸贏都即刻走人。 我試過帶兩萬文去, 贏咗十幾萬翻嚟!,哇,咁巴閉吖! 我啲老人家邊敢咁

40、狼, 抵你發達咯!,以上情节并非虚构,如有雷同,不属巧合。 麦太人物原型,一老阿姨 麦兜人物原型,司机 江湖,卧虎藏龙!一个不起眼的司机,竟然也知道“赌徒输光理论”! 顺便小小BS下关老师这个偷听狂!,q,三、 直线上的随机游动,吸收或反射,吸收或反射,一个随机质点在初始时刻 t = 0 从初始位置 x = a 出发,每单位时间随机向右(概率为p)或向左移动(概率为q)一个单位(p+q=1).,p,当 时,随机游动称为对称的,这时质点向左或向右移动的可能性相等。,自然科学中的大量问题归结为随机游动问题,例如随机游动模型可以作为布朗运动的初步近似等,事实上,随机游动可以看作是伯努利试验的一种描述

41、法。,假定质点在时刻0从原点出发,以 记它在时刻 的位置。,1. 无限制的随机游动 有无穷赌本的赌徒在n局后的输赢,(Sn = k) , -n k n,表示 “在n次游动中向右次数比向左多了k次” 向右次数+ 向左次数 = n 向右次数 - 向左次数 = k,即,因为 x 是整数,所以 k 必须与 n 具有相同的奇偶性。,若以 x 记它在n 次游动中向右移动的次数,y 记向左移动的次数,则,事件 发生相当于要求在前n 次游动中有 次向右, 次向左,利用二项分布可得,当k与n奇偶性相异时,概率为0。,质点在时刻 t = 0 时,位于 x = a,而在 x= 0 与 x=a+b 处各有一个吸收壁.

42、,2. 两端带有吸收壁的随机游动,有穷赌本的赌徒的输赢,记,qn = P质点从 x = n 出发被 a+b 点吸收,同时,由全概率公式,我们有递归方程,显然,,Solution,若 pq,则 特别地, 若 pq,则 特别地,,记,pn = P质点从 x = n 出发被 0 点吸收,类似地,可求得,不论何种情况,总有,赌博游戏中,只要无人“割禾青”,总有一方会输光; 如果赌博公平,赌本越大越有利; 如果赌博不公平,谁的概率大,谁就会笑到最后。,四、 推广的伯努利试验与多项分布,二项分布可以容易地推广到 n 次重复独立试验且每次试验可能有若干个结果的情形。,把每次试验的可能结果记为 ,而,且,当

43、时,我们得到伯努利试验。,不难导出:在 n 次试验中 出现 次, 出现 次, 出现 次的概率为,这里 ,且 。,(5),公式(5)称为多项分布,它是二项分布的推广,二项分布中的很多结果都能平行地推广到多项分布的场合。,例6 平面上的随机游动,一质点从平面上某点出发,等可能的向上、下、左及右方向移动,每次移动的距离为1,求经过2n次移动后回到出发点的概率。,【解】,这可以归结为上述推广的伯努利试验的问题。,分别以事件 表示质点向上,下,左, 右移动一格,则,若要在2n次移动后回到原来的出发点,则向左移动的次数与向右移动的次数应该相等,向上移动的次数与向下移动的次数也应该相等。,而总移动次数为2n

44、,故所求的概率为,Exercise P.113 23. 小概率事件必然发生,假定随机事件 A 在一次试验中发生概率是 p,(无论多小、只需 p 0),如果不停地独立重复,进行试验,那么 A 最终必然要发生。,Proof 记 Dk = A 在第 k 次试验时发生,k1 , 由于是独立试验,这些 Dk 相互独立, 因此它们,的对立事件 A 在第 k 次试验时没有发生 也 相互独立。我们只需要证明:,因为 A 每次试验时发生的概率 p 0 , 即 1 - p 1,所以当不停独立重复试验时 无论每次发生的概率有多小,这个随机 事件最终必然会发生。,有志者,事竟成,有关小概率事件的认识,一般认为发生概率

45、 0.05 的一个,随机事件就可以称为是小概率事件。,假如只做一次试验,那么一个小概率事件,在这次试验里是不应该发生的。,如果不停重复试验,只要它不是不可能 事件,最终这个事件都会必然发生。,Jacob Bernoulli,Born: 27 Dec 1654 in Basel, Switzerland Died: 16 Aug 1705 in Basel, Switzerland,伯努利资料,“纵然变化, 依然故我”,Jacob Bernoullis grave.,伯努利家族出现了3位出类拔萃的数学家。最不可思议的是这3位数学家,都违背了父亲的意愿,忘情地沉溺于数学之中,有人调侃他们就像酒鬼碰

46、到了烈酒。 1654年12月27日,雅各布伯努利生于巴塞尔,分别于17,22岁时获艺术硕士学位及神学硕士学位。然而,他还是选择了忠于自己,自学了数学和天文学,他的终身职业是巴塞尔大学的数学教授。 他是最早使用“积分”这个术语的人,也是较早使用极坐标系的数学家之一。他研究了悬链线,还确定了等时曲线的方程。数论中有以他命名的伯努利数。 概率论是伯努利对数学作出的最大贡献。他提出了伯努利试验与大数定理,他的猜度术是概率论的第一部奠基性著作。,4. 二项分布与Poisson分布,一、二项分布的性质及计算,1. 二项分布的背景,它对应于随机抽样模型中的有放回抽样, 二项分布也与独立试验序列概型有关,即

47、在 n 重 Bernoulli 试验中,随机事件 A 发生 的次数服从参数为 n、p 的二项分布; 二项分布广泛应用于抽样调查的问题中, 以及在金融,保险,医学,生物遗传学等 都有重要的应用。,Recall,n重伯努利试验中事件 出现 k 次的概率:,对于固定n 及 p,当k 增加时, 概率 先是随之增加直至达到最大值 , 随后单调减少.,最可能成功次数,当(n+1) p =m为整数时, 在 k = m 和 k = m-1处达到最大值.,当(n+1) p 不为整数时, 在 k =(n+1) p达到最大值;,Recall 以反证法证明 先假设 再论证 ( 表示不可能事件)从而拒绝 假设检验原理 设 样本值为 假设 成立. 若 为小概率事件,则拒绝 或更精确地,取定 作为显著性水平,若 则拒绝,很少经由统计去证明那件事必是对的。 探

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1