协方差及相关系数[高教课堂].ppt

上传人:scccc 文档编号:11883995 上传时间:2021-10-12 格式:PPT 页数:37 大小:1.46MB
返回 下载 相关 举报
协方差及相关系数[高教课堂].ppt_第1页
第1页 / 共37页
协方差及相关系数[高教课堂].ppt_第2页
第2页 / 共37页
协方差及相关系数[高教课堂].ppt_第3页
第3页 / 共37页
协方差及相关系数[高教课堂].ppt_第4页
第4页 / 共37页
协方差及相关系数[高教课堂].ppt_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《协方差及相关系数[高教课堂].ppt》由会员分享,可在线阅读,更多相关《协方差及相关系数[高教课堂].ppt(37页珍藏版)》请在三一文库上搜索。

1、一、协方差与相关系数的概念及性质,二、相关系数的意义,三、小结,第三节 协方差及相关系数,1,教学运用,前面我们学习了随机变量的数学期望和方差,对于多维随机变量,除了其数学期望和方差外,我们还要研究反映各分量之间关系的数字特征,其中最重要的,就是现在要讨论的,协方差和相关系数,1. 问题的提出,一、协方差与相关系数的概念及性质,2,教学运用,在讨论这个问题之前,我们先看一个例子。在研究子女与父母的相象程度时,有一项是关于父亲的身高和其成年儿子身高的关系。,3,教学运用,这里有两个变量,一个是父亲的身高,一个是成年儿子身高.为了研究二者关系,英国统计学家皮尔逊收集了1078个父亲及其成年儿子身高

2、的数据, 画出了一张散点图。,问:父亲及其成年儿子身高存在怎样的关系呢?,4,教学运用,类似的问题有:,1、吸烟和患肺癌有什么关系?,5,教学运用,6,教学运用,定义 对两个随机向量(X,Y),若E(X-EX)(Y-EY)存在, 则称 cov(X,Y)=E(X-EX)(Y-EY) 为X和Y的协方差。,特别, 若X=Y,则 cov(X,X)=E(X-EX)2=D(X),因此,方差是协方差的特例, 协方差刻画两个随机变量之间的“某种”关系.,可以证明 若(X,Y)服从二维正态分布,即,则,2. 定义,7,教学运用,可见,若X与Y独立,则,4. 计算协方差的一个简单公式,Cov(X,Y)= 0 .,

3、Cov(X,Y)=E(XY)-E(X)E(Y),D(X+Y)= D(X)+D(Y)+2Cov(X,Y),3 随机变量和的方差与协方差的关系,8,教学运用,(5) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y),(3) Cov(X,Y)=Cov(Y,X) (对称性),5.简单性质,(4) Cov(aX,bY)=abCov(X,Y) 其中 a、b是常数,下面请大家利用上面所学的知识进行证明。,(1) Cov(X,X)=D(X),(2) Cov(X,c)=0 (c为常数),9,教学运用,协方差的数值在一定程度上反映了X与Y相互间的联系,但它受X与Y本身数值大小的影响.如令X*=kX

4、,Y*=kY,这时X*与Y*间的相互联系和X与Y的相互联系应该是一样的,但是,Cov(X*,Y*)=k2Cov(X,Y),为了克服这一缺点,在计算X与Y的协方差之前,先对X与Y进行标准化:,再来计算X*和Y*的协方差,这样就引进了相关系数的概念.,10,教学运用,为随机变量X和Y的相关系数 (correlation coefficient).,1.定义:若D(X)0, D(Y)0,且Cov(X,Y)存在时,称,在不致引起混淆时,记 为 .,二、相关系数,11,教学运用,2. 相关系数的性质,注意 |XY| 的大小反映了X,Y之间线性关系的密切程度: XY=0时, X,Y之间无线性关系; |XY

5、|=1时,X,Y之间具有线性关系.,12,教学运用,XY0,X,Y正相关 XY0,X,Y负相关,XY 0,X,Y相关 XY=0,X,Y不相关,(XY=1,X,Y完全正相关),(XY=-1,X,Y完全负相关),完全正相关 Y=aX+b a0,完全负相关 Y=aX+b a0,13,教学运用,x,y,0,完全不相关,正相关,负相关,14,教学运用,例:将一枚密度均匀硬币抛n次,分别以X和Y记作正反面出现的次数,则X和Y的相关系数为,A:0 B:1 C:-1 D:1或-1,解:因为XYn,即PY=-X+n=1, 所以X与Y完全负相关,故,从而选C。,注:若,15,教学运用,例2 (X,Y)的联合分布为

6、:,求相关系数XY,并判断X, Y是否相关,是否独立.,解:,16,教学运用,例2 (X,Y)的联合分布为:,求相关系数XY,并判断X, Y是否相关,是否独立.,解:,从而:,另一方面:,P(X=-1,Y=-1)=1/8 P(X=-1)P(Y=-1)=(3/8)(3/8),所以X与Y不独立.,17,教学运用,这里可以利用相关系数的定义和微积分的知识可得 即 为X和Y的相关系数,,18,教学运用,结论,19,教学运用,例3,解,20,教学运用,21,教学运用,X , Y 不相关,X ,Y 相互独立,X , Y 不相关,若 ( X , Y ) 服从二维正态分布,,X , Y 相互独立,X , Y

7、不相关,不相关与相互独立,22,教学运用,解,例4,23,教学运用,24,教学运用,25,教学运用,这一讲我们主要介绍了协方差和相关系数,相关系数是刻划两个随机变量间线性相关程度的重要的数字特征,它取值在-1到1之间.,如果两个变量之间存在强相关,则已知一个变量的值对预测另一个变量的值将很有帮助,如前面几个引例。,小 结,26,教学运用,1.定义,27,教学运用,2. 协方差矩阵,28,教学运用,29,教学运用,例 设随机变量X和Y相互独立且XN(1,2), YN(0,1). 试求Z=2X-Y+3的概率密度.,故X 和Y 的联合分布为正态分布,X 和Y 的任意线性组合是正态分布.,解: XN(

8、1,2),YN(0,1),且 X 与Y 独立,D(Z)=4D(X)+D(Y)=8+1=9,E(Z)=2E(X)-E(Y)+3=2+3=5,即 ZN(E(Z), D(Z),30,教学运用,故 Z 的概率密度是,ZN(5, 32),31,教学运用,契比雪夫不等式,证明,取连续型随机变量的情况来证明.,切比雪夫不等式,32,教学运用,得,33,教学运用,切比雪夫不等式只利用随机变量的数学期望及方差就可对的概率分布进行估计。 从切比雪夫不等式还可以看出, 对于给定的 0, 当方差越小时,事件|X-E(X)|发生的概率也越小,即X的取值越集中在E(X)附近这进一步说明方差确实是一个描述随机变量与其期望值

9、离散程度的一个变量 当D(X)已知时,切贝雪夫不等式给出了X与E(X)的偏差小于 的概率的估计值,切比雪夫不等式的用途: (1)证明大数定律;(2)估计事件的概率。,34,教学运用,例1 已知正常男性成人血液中 ,每一毫升白细胞数平均是7300,均方差是700 . 利用切比雪夫不等式估计每毫升白细胞数在52009400之间的概率 .,解:设每毫升白细胞数为X,依题意,E(X)=7300,D(X)=7002,所求为 P(5200 X 9400),P(5200 X 9400),= P(-2100 X-E(X) 2100),= P |X-E(X)| 2100,35,教学运用,由切比雪夫不等式,P |X-E(X)| 2100,即估计每毫升白细胞数在52009400之间的概率不小于8/9 .,36,教学运用,例2 设电站供电网有10000盏电灯,夜晚每盏灯开灯的概率均为0.7,假定灯的开、关是相互立的,使用切贝雪夫不等式估计夜晚同时开着的灯数在6800到7200盏之间的概率。 解 令X表示在夜晚同时开着的灯数目,则X服从n=10000,p=0.7的二项分布,这时,由切贝雪夫不等式可得:,37,教学运用,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1