第十九章直线相关和回归分析.ppt

上传人:本田雅阁 文档编号:3128644 上传时间:2019-07-14 格式:PPT 页数:50 大小:1.61MB
返回 下载 相关 举报
第十九章直线相关和回归分析.ppt_第1页
第1页 / 共50页
第十九章直线相关和回归分析.ppt_第2页
第2页 / 共50页
第十九章直线相关和回归分析.ppt_第3页
第3页 / 共50页
第十九章直线相关和回归分析.ppt_第4页
第4页 / 共50页
第十九章直线相关和回归分析.ppt_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《第十九章直线相关和回归分析.ppt》由会员分享,可在线阅读,更多相关《第十九章直线相关和回归分析.ppt(50页珍藏版)》请在三一文库上搜索。

1、第十九章 直线相关和回归分析,双变量计量资料:每个个体有两个变量值 总体:无限或有限对变量值 样本:从总体随机抽取的n对变量值 (X1,Y1), (X2,Y2), , (Xn,Yn) 目的:研究X和Y的数量关系 方法:回归与相关 简单、基本直线回归、直线相关,目前,“回归”已成为表示变量之间某种数量依存关系的统计学术语,并且衍生出“回归方程”“回归系数”等统计学概念。如研究糖尿病人血糖与其胰岛素水平的关系,研究儿童年龄与体重的关系等。,第一节 直线相关,直线相关(linear correlation):是研究两个变量之间是否存在相关关系的一种统计方法。 适用条件:线性、双变量正态分布资料。 相

2、关分析是用于分析两变量间的互依关系。,一、线性相关的基本概念,例19-1 为研究中年女性体重指数和收缩压之间的关系,随机测量了16 名40 岁以上的女性的体重指数和收缩压,见表19-1,试绘制散点图。,图19-1 16名中年女性体重指数与收缩压散点图,图19-2 相关示意图,相关系数又称积差相关系数(coefficientf product-moment correlation),它说明两变量之间线性关系的密切程度与方向的统计指标。样本用r表示,总体用。 -1r1,二、直线线性相关系数,(19-1),相关系数对样本相关关系的计量,计算例19-1的相关系数,(19-2),第一种方法:t检验法,三

3、、线性相关系数的假设检验,1、建立假设:H0:=0 H1:0 =0.05 2、计算检验统计量,3、确定P值,作出统计推论,1、建立假设:H0:=0 H1:0 =0.05 2、计算检验统计量 n=16,r=0.91097,自由度=16-2=14。,3、查r界值表,得统计结论 查r界值表(附表19-1),得r0.01(14)=0.623,因为r r0.01(14),故P0.01,按=0.05水准拒绝H0,接受H1,可以认为体重指数与收缩压之间存在正相关关系。,第二种方法:查表法,第二节 直线回归,目的: 在因变量Y和自变量X之间建立一个数学模型,根据这个模型可以根据自变量的变动预测因变量的变动。,

4、一、线性回归的概念,区别于函数关系和统计关系,函数关系: 两变量的数量表现在一定条件下是完全确 定的。 如: 圆的面积和半径的关系 统计关系(相关关系):两变量的数量表现尽管存在着密切关系,但却不是完全确定的。 如:成本和利润的关系,样本线性回归方程,为给定X 时Y 的估计值。,简单线性回归模型,a 为回归直线在 Y 轴上的截距 即x 取0时,y 的平均估计值,a 0,表示直线与纵轴的交点在原点的上方 a 0,则交点在原点的下方 a = 0,则回归直线通过原点,b为回归系数,即直线的斜率,b0,直线从左下方走向右上方,Y 随 X 增大而增大 b0,直线从左上方走向右下方,Y 随 X 增大而减小

5、 b=0,表示直线与 X 轴平行,X 与Y 无直线关系,b 的统计学意义是:X 每增加(减)一个单位, 平均改变b个单位,建立 线性回归模型的步骤,1、确定研究的问题 2、设样本回归模型(如: ) 3、搜集样本资料(数据资料) 4、估计未知参数(计算统计量) 5、得到样本回归方程 6、用模型预测因变量,建立 样本线性回归模型的方法 -最小二乘法,实际观察值与样本回归线上 的点的距离的平方和最小,X,Y,e1,e2,e3,e4,最小,截距(intercept),回归系数,(19-8),(19-6),(19-7),二、直线回归方程的求法,例19-1 为研究中年女性体重指数和收缩压之间的关系,随机测

6、量了16 名40 岁以上的女性的体重指数和收缩压,见表19-1,试进行回归分析。,图19-1 16名中年女性体重指数与收缩压散点图,考察线性、 异常值,1、做散点图,2、求回归系数与常数项,3、列出回归方程,4. 作回归直线,在自变量X的实测值范围内取相距较远且对 易于计算的两个X值,代入方程,求出两个Y值,连接两点的连线,既得直线。,三、线性回归方程的假设检验,回归系数的假设检验 检验总体回归系数是否为零可用方差分析或与其等价的t检验。,1、建立假设: H0:=0 H1: 0 =0.05,t检验,2、计算检验统计量:,3、确定P值,作出统计推论: 查t界值表,得P0.01,拒绝H0。,四、

7、直线相关和回归应注意的事项,(一)相关分析注意的事项 1、要有实际意义,不能把毫无关联的两种现象勉强作分析。且相关系数的意义仅限于样本资料中变量的取值范围。 2、相关关系不一定是因果关系,可能仅是表面上的伴随关系,或两个变量同时受另一因素的影响。但对原因一无所知时,有助于寻找事物的原因。,3、不能只根据相关系数绝对值的大小来推断两事物现象之间有无相关以及相关的密切程度,而必须进行相关系数的显著性检验。 4、关于相关分析的样本的合并与分层问题,应审慎对待。,当且仅当分层情形下,两变量的关系不会因为合并而被歪曲时才可考虑合并。 (a)(b)无相关相关 (c)相关无相关 (d)正相关负相关,5、散点

8、图在相关分析中具有重要作用,要充分利用,注意观察有无离群值。,(二)回归分析的注意事项,1、要有实际意义,不能把毫无关联的两种现象,随意进行回归分析。 2、要求Y是来自正态分布总体的随机变量,X可以是正态随机变量,也可以是精确测量和严格控制的值。 3、应先绘制散点图。判断直线或曲线趋势。 4、若出现离群值,应及时核查测定、记录或录入的错误。 5、回归直线不要外延。,(三) 直线回归与相关的区别和联系,1、区别: 1、资料要求不同 因变量服从正态分布-型回归 因变量与自变量服从双变量正态分布-型回归,可做直线相关分析。 2、应用情况不同 回归说明依存数量关系,相关说明互依关系。,2、联系,1、方

9、向一致 2、假设检验等价tr=tb 3、用回归解释相关 决定系数(coefficient of determination)r2:指回归平方和SS回占总离均差平方和SS总的比例。用于评价在y的总变异中,由线性回归方程所能解释的比例。,4、r、b可互相推导,第三节 等级相关,适用条件: 1、不服从双变量正态分布 2、总体分布型未知 3、原始数据用等级表示的资料,例19-6 为探讨硒与大骨节病之间的关系,分别检测了1990-1999 年某地7-12 岁儿童中大骨节病X 射线阳性检出率和发硒的平均水平如表19-2,试对其进行等级相关分析。,一、Spearman等级相关,基本思想: 计算公式:,19-12,总体等级相关系数s的检验,1、n50时,用查表法(附表12) 2、n50时,,用直线相关的t检验,3、查rs界值表,得统计结论 查rs界值表(附表19-2),得r0.01(9)=0.833,因为 r r0.01(9) ,故P0.01,按=0.05水准拒绝H0,接受H1,可以认为儿童大骨节病阳性检出率与发硒的含量有关系。,附表11 r界值表(双侧尾部面积),附表11 r界值表(双侧尾部面积),附表12 rs界值表,END,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1