1.3多维数据的数字特征及相关分析.ppt

上传人:本田雅阁 文档编号:3457962 上传时间:2019-08-27 格式:PPT 页数:35 大小:1.22MB
返回 下载 相关 举报
1.3多维数据的数字特征及相关分析.ppt_第1页
第1页 / 共35页
1.3多维数据的数字特征及相关分析.ppt_第2页
第2页 / 共35页
1.3多维数据的数字特征及相关分析.ppt_第3页
第3页 / 共35页
1.3多维数据的数字特征及相关分析.ppt_第4页
第4页 / 共35页
1.3多维数据的数字特征及相关分析.ppt_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《1.3多维数据的数字特征及相关分析.ppt》由会员分享,可在线阅读,更多相关《1.3多维数据的数字特征及相关分析.ppt(35页珍藏版)》请在三一文库上搜索。

1、1,1.3 多维数据的 数字特征及相关分析,2,1.3 多维数据的数字特征及相关分析,基本内容,均值 协方差 Pearson相关系数 Spearman相关系数,p维总体均值向量 协方差矩阵 相关系数矩阵 随机向量的性质 多维正态分布,观测数据协方差 Pearson相关矩阵 Spearman相关矩阵 proc corr过程实现,1.3.1 二维数据的数字特征及相关系数,1.3.3 多维数据的数字特征及相关矩阵,1.3.2 多维总体的数字特征、相关矩阵及多维正态分布,3,1.3 多维数据的数字特征及相关分析,均值 协方差 Pearson相关系数 Spearman相关系数,1.3.1 二维数据的数字

2、特征及相关系数,4,复习:数据的分布,直方图、经验分布函数、QQ图、茎叶图,5,一. 二维总体的数字特征及相关系数,1.3.1 二维数据的数字特征及相关系数,6,二维数字特征的性质,当X与Y相互独立时,,(3),(2),(1),1.3.1 二维数据的数字特征及相关系数,7,二观测数据协方差、相关系数、检验,样本协方差,样本协方差矩阵,样本均值,样本方差,1.3.1 二维数据的数字特征及相关系数,观测矩阵,1.3.1 二维数据的数字特征及相关系数,总体(X,Y)T,样本,8,Pearson相关系数,Pearson相关系数矩阵,注:1. Pearson相关系数反映 两随机变量线性相关强 弱,散点图

3、见书图1.11. 2.由Schwarz不等式知,1.3.1 二维数据的数字特征及相关系数,二观测数据协方差、相关系数、检验,3.n充分大时,,9,当(X,Y)T 为二维正态,二维随机变量相关性检验,观测数据,假设检验,统计量,认为|t|过大,拒绝假设,认为X与Y相关.,检验p值,给定 ,当 ,拒绝H0.认为X与Y相关;否则,不相关.,1.3.1 二维数据的数字特征及相关系数,二观测数据协方差、相关系数、检验,10,1秩统计量,三Spearman相关系数,秩统计量:,例 观测值 -0.8, -3.1, 1.1, -5.2 4.2,如 -0.8,-3.1,-0.8 秩统计量 2, 1, 3 或 3

4、, 1, 2 记为 2.5 1, 2.5,秩统计量,规定:相同观测值,秩统计量取排序的平均值。,1.3.1 二维数据的数字特征及相关系数,11,注:当X,Y相关性较强,两组秩统计量相关性也较强,2Spearman相关系数,秩统计量分别为,Spearman相关系数:,1.3.1 二维数据的数字特征及相关系数,12,基于Spearman相关系数的假设检验,统计量,检验P值,1.3.1 二维数据的数字特征及相关系数,13,四SAS系统 proc corr过程,1.3.1 二维数据的数字特征及相关系数,14,四SAS系统 proc corr过程,解:程序 data examp1_9; input x

5、y ; cards; 68 971 63 892 70 1125 6 82 65 931 9 112 10 162 12 321 20 315 30 375 33 462 27 352 21 305 5 84 14 229 27 332 17 185 53 703 62 872 65 740 ; run; proc corr data=examp1_9 pearson spearman cov; /*方差描述性过程,输出Pearson ,Spearman相关矩阵,协方差阵*/ run;,1.3.1 二维数据的数字特征及相关系数,15,例1.9结果输出 CORR 过程 2 变量: x y 协方差

6、矩阵S,自由度n-1 = 19 x y x 570.4500 7845.0789 y 7845.0789 112404.2632 简单统计量 变量 N 均值 标准偏差 中位数 最小值 最大值 x 20 33.85000 23.88410 27.00000 5.00000 70.00000 y 20 477.50000 335.26745 342.00000 82.00000 1125,Spearman 相关系数, N = 20 当 H0: Rho=0 时,Prob |r| x y x 1.00000 =0.97366 p.0001 y 0.97366 1.00000 .0001,Pearson

7、 相关系数, N = 20 当 H0: Rho=0 时,Prob |r| x y x 1.00000 =0.97971 相关性显著 p.0001 y 0.97971 1 .0001,1.3.1 二维数据的数字特征及相关系数,16,结果分析:,(1)利用proc corr过程,得,(2)数据的Pearson相关系数,(3)数据的Spearman相关系数,检验p值均,X与Y的相关性高度显著.,1.3.1 二维数据的数字特征及相关系数,17,1.3 多维数据的数字特征及相关分析,观测数据协方差 Pearson相关矩阵 Spearman相关矩阵 proc corr过程实现,1.3.2 多维总体的数字特

8、征、相关矩阵及多维正态分布,18,1.3.2 多维总体数字特征、相关矩阵及正态分布,一.p维总体的数字特征、相关系数矩阵,分布函数,p维总体,连续总体概率密度,均值向量:,总体协方差矩阵:,19,总体相关矩阵:,1.3.2 多维总体数字特征、相关矩阵及正态分布,20,二随机向量的性质,(1)A 常量矩阵, 常向量,则,(2)B 常量矩阵,1.3.2 多维总体数字特征、相关矩阵及正态分布,21,三多维正态分布,1二维正态分布及性质,其中,1.3.2 多维总体数字特征、相关矩阵及正态分布,22,2. p维正态分布,p维正态分布,密度,协方差阵,均值向量,1.3.2 多维总体数字特征、相关矩阵及正态

9、分布,23,(1)线性组合为正态分布,(2)分量为正态分布,(3)分量独立 不相关,3.多维正态分布性质,1.3.2 多维总体数字特征、相关矩阵及正态分布,24,1.3 多维数据的数字特征及相关分析,观测数据协方差 Pearson相关矩阵 Spearman相关矩阵 proc corr过程实现,1.3.3 多维数据的数字特征及相关矩阵,25,一样本观测数据的协方差、相关矩阵,p维总体:,数据的协方差、方差,均值向量,样本协方差矩阵,样本观测数据矩阵,1.3.3 多维数据的数字特征及相关分析,26,1.3.3 多维数据的数字特征及相关分析,Pearson相关系数矩阵,Spearman相关系数矩阵,

10、27,注意:1.原数据的相关系数矩阵即为标准化数据协方差阵.,标准化数据矩阵:,2. n充分大时,有,对Xj数据标准化,得标准化数据矩阵;每行为标准化后样品观测向量,1.3.3 多维数据的数字特征及相关分析,28,例1.10 测20个3个生理指标:体重(X1)、腰围(X2)、脉搏(X3);3个训练指 标:引体向上(X4)、仰卧起坐(X5)、跳跃(X6)次数.数据见书表1.2: 解: 程序:,二SAS系统 proc corr过程,data exam1_10; input x1-x6; cards; 191 36 50 5 162 60 156 33 54 15 225 73 138 33 68

11、2 110 43 ;,proc corr data=exam1_10 cov pearson spearman; /* 调用Corr过程,输出协方差,Pearson,Spearman相关系数矩阵*/ var x1-x6; run;,1.3.3 多维数据的数字特征及相关分析,29,(1) 计算观测数据均值向量、协方差阵、Pearson相关阵,CORR 过程 6 变量: x1 x2 x3 x4 x5 x6 简单统计量 变量 N 均值 标准偏差 中位数 最小值 最大值 x1 20 178.60000 24.69051 176.00000 138.00000 247.00000 x2 20 35.40

12、000 3.20197 35.00000 31.00000 46.00000 x3 20 56.10000 7.21037 55.00000 46.00000 74.00000 x4 20 9.45000 5.28628 11.50000 1.00000 17.00000 x5 20 145.55000 62.56658 122.50000 50.00000 251.00000 x6 20 70.30000 51.27747 54.00000 25.00000 250.00000,1.3.3 多维数据的数字特征及相关分析,30,样本协方差矩阵S,自由度 = 19 =样本个数-1 x1 x2 x

13、3 x4 x5 x6 x1 609.62105 68.80000 -65.11578 -50.86316 -761.71578 -286.50526 x2 68.800000 10.252632 -8.147368 -9.347368 -129.336842 -31.442105 x3 -65.115789 -8.147368 51.989474 5.742105 101.521053 12.915789 x4 -50.863158 -9.347368 5.742105 27.944737 230.107895 134.384211 x5 -761.715789 -129.33684 101.

14、521053 230.107895 3914.57632 2146.98421 x6 -286.505263 -31.442105 12.915789 134.38421 2146.98421 2629.37895,1.3.3 多维数据的数字特征及相关分析,31,Pearson相关系数矩阵R Pearson 相关系数, N = 20 当 H0: Rho=0 时,Prob |r| x1 x2 x3 x4 x5 x6 x1 1.00000 =0.87024 -0.36576 -0.38969 -0.49308 -0.22630 相关性好 p12.0001 0.1128 0.0894 0.0272

15、0.3374 x2 0.87024 1.00000 -0.35289 -0.55223 -0.64560 -0.19150 .0001 0.1270 0.0116 0.0021 0.4186 x3 -0.36576 -0.35289 1.00000 0.15065 0.22504 0.03493 0.1128 0.1270 0.5261 0.3401 0.8838 x4 -0.38969 -0.55223 0.15065 1.00000 0.69573 0.49576 0.0894 0.0116 0.5261 0.0007 0.0262 x5 -0.49308 -0.64560 0.22504

16、 0.69573 1.00000 0.66921 0.0272 0.0021 0.3401 0.0007 0.0013 x6 -0.22630 -0.19150 0.03493 0.49576 0.66921 1.00000 0.3374 0.4186 0.8838 0.0262 0.0013,1.3.3 多维数据的数字特征及相关分析,32,Spearman 相关系数, N = 20 当 H0: Rho=0 时,Prob |r| x1 x2 x3 x4 x5 x6 x1 1.00000 0.81423 -0.37070 -0.38020 -0.57774 -0.19902 .0001 0.10

17、76 0.0982 0.0076 0.4002 x2 0.81423 1.00000 -0.23770 -0.54190 -0.72473 -0.19940 .0001 0.3129 0.0136 0.0003 0.3993 x3 -0.37070 -0.23770 1.00000 0.13662 0.17924 0.09841 0.1076 0.3129 0.5657 0.4496 0.6798 x4 -0.38020 -0.54190 0.13662 1.00000 0.65620 0.32263 0.0982 0.0136 0.5657 0.0017 0.1653 x5 -0.57774

18、 -0.72473 0.17924 0.65620 1.00000 0.69521 0.0076 0.0003 0.4496 0.0017 0.0007 x6 -0.19902 -0.19940 0.09841 0.32263 0.69521 1.00000 0.4002 0.3993 0.6798 0.1653 0.0007,(2)Spearman相关矩阵,1.3.3 多维数据的数字特征及相关分析,33,由Pearson相关系数矩阵输出结果,取显著水平 ,则,(3)分析各指标间的相关性,检验值均满足p0.1,接受原假设,认为各相应随机变量对相关 性很小,认为0. 类似,Pearsman相关系数矩阵的下列检验值p0.1,1.3.3 多维数据的数字特征及相关分析,34,35,概念总结(纸质作业): 1.一位数据的数字特征哪些?写出公式,说明作用. 2.说出数据的几种图形表示法,正态性的检验方法(统计量、检验p值、判断). 3.写出多维数据的数字特征、多维总体的数字特征及性质、多维正态分布密度.,作业 1.5 1.6,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1