第九章相关与回归.doc

上传人:本田雅阁 文档编号:2715374 上传时间:2019-05-07 格式:DOC 页数:14 大小:321.54KB
返回 下载 相关 举报
第九章相关与回归.doc_第1页
第1页 / 共14页
第九章相关与回归.doc_第2页
第2页 / 共14页
第九章相关与回归.doc_第3页
第3页 / 共14页
第九章相关与回归.doc_第4页
第4页 / 共14页
第九章相关与回归.doc_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《第九章相关与回归.doc》由会员分享,可在线阅读,更多相关《第九章相关与回归.doc(14页珍藏版)》请在三一文库上搜索。

1、 第九章 相关与回归2相关和回归分析是研究事物的相互关系,测定它们联系的紧密程度,揭示其变化的具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、预测和控制的重要工具。本章介绍相关和回归分析的基本原理和系统分析的方法。第一节 相关的概念和二元概率分布1什么是相关关系?变量之间关系函数关系相关关系共变关系互为因果关系因果关系确定性依存关系 不确定(随机性)依存关系2相关关系种类正 相 关一元相关线性相关负 相 关多元相关曲线相关yxxyxxyxxyxxxxxxxxxxxxxx 正相关 负相关 曲线相关 不相关3二元概率分布例:某企业200名职工的企业工龄和时工资的分布企业工龄

2、(年)x时工资级别(元)y总计123120(0.10)0(0)0(0)20(0.10)240(0.20)10(0.05)0(0)50(0.25)324(0.12)24(0.12)12(0.06)60(0.30)416(0.08)26(0.13)8(0.04)50(0.25)50(0)0(0)20(0.10)20(0.10)总计100(0.50)60(0.30)40(0.20)200(1)联合频数联合概率边缘频数边缘概率二元概率分布的5个特征值:(1) x的数学期望:(2) y的数学期望:(3) x的方差:(4) y的方差:(5)x与y的协方差: 可度量x与y之间的线性相关关系第二节 简单线性相

3、关从散点图看协方差的作用一、相关系数yIIIIVIII0x协方差xy可表明x、y的“共变性”和线性相关的方向。但不是一个适用于比较的相关关系的量度。积矩相关系数是对它的改进。未分组资料:分组资料:二、相关系数的检验(t检验)H0 : p=0, H1 : p0 检验统计量第三节 一元线性回归模型一、回归的概念和回归分析的特点回归分析和相关分析的联系和区别 联 系区 别 理论和方法具有一致性; 无相关就无回归,相关程度越高,回归越好; 相关系数和回归系数方向一致,可以互相推算。 相关分析中,x与y对等,回归分析中,x与y要确定自变量和因变量; 相关分析中x,y均为随机变量,回归分析中,只有y为随机

4、变量; 相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。二、一元线性回归模型 (一)一元线性回归模型的性质斜率(回归系数)截距回归系数b表明自变量x每变化一个单位因变量y的增(减)量。1b与r的关系:r0b0r0b0r=0b=0aaa000xyyyb-bxx2是理论模型,表明x与y两变量之间的平均变动关系。(实际值):随机干扰:各种偶然因素,观察误差和其他被忽视因素的影响。X对y的线性影响而形成的系统部分,反映两变量的平均变动关系,即本质特征。yx0(二)一元线性回归模型的确定 根据实际数据,用最小平方法,即使 ,分别对a、b求编导并令其为零,求得两个标准方程: 解联立方程,得到

5、 三、判定系数(r2)和估计标准误(Sxy) (一)判定系数(r2) 判定系数是对回归模型拟合优度的评价。Y0yx0 总偏差 = 回归偏差 + 剩余偏差 r2表示全部偏差中有百分之几的偏差可由x与y的回归关系来解释。 (相关系数) (二)估计标准误(Sxy) Sxy是二元正态分布中因变量实际值(yj)对估计值( )离散程度的量度。xy9973%9445%6827% Sxy 越小, 拟合越好; Sxy 越大, 拟合越差。 Sxy也是用自变量对因变量进行区间估计的抽样误差。四、一元线性回归模型的显著性检验 (一)回归系数b的检验 设总体回归系数为0 H0:=0;H1:0 1n30时 检验统计量 (

6、=0) b是样本回归系数抽样分布的标准差。通常是未知的,用其估计量 代替。 给定显著性水平,查Z表可知其临界值 。 2n30时 检验统计量 (=0) 给定显著性水平,查t表可知其临界值 。(二)回归模型整体的F检验检验统计量 或 (可见,F检验实质上是对总体回归模型H0:R2=0的检验。)五、应用一元回归模型进行区间估计 1n30时+3Sxyy 给定x0,y0的置信度(1-)+2Sxy 的置信区间为:+1Sxy -1Sxy -2Sxy-3Sxyx00x 2.n30时 给定x0,y0的置信度(1-) 的置信区间为:y0x0x 给定的x0越接近 ,y值估计的精确度越高。第四节 多元线性回归模型一、

7、多元线性回归模型的性质与模型的确定 1模型性质 模型的一般形式: 二元线性回归模型: 截距 偏回归系数 b1:假定x2固定时x1每变动1个单位引起的y的增量。 b2:假定x1固定时x2每变动1个单位引起的y的增量。 ,是x1和x2共同变动引起的y的平均 变动,反映一组自变量与因变量的平均变动关系。 是给定x1、x2计算得到的估计值,是y的实际值的数学期望。 (实际值)随机干扰:各种偶然因素观察误差和其他被忽视因素的影响。一组自变量对y的线性影响而形成的系统部分,反映x与y变动关系的本质特征。 2模型的确定 根据实际资料,用最小平方法,即使 ,分别对a、b1、b2求编导并令其为零,求得三个标准方

8、程: 解此联立方程便可得到a、b1、b2。 二、多元线性回归模型的判定系数和估计标准误 (一)判定系数 0r21 (二)估计标准误(Sy(x1、x2) r2和Sy(x1、x2)都是对回归模型拟合优度的评价指标。Sy(x1、x2)也是用自变量对因变量进行区间估计的抽样误差。三、多元回归模型的显著性检验 (一)对偏回归系数的t检验 H0: 1=0 ,H1: 10;H0: 2=0,H1: 20。 检验统计量: 按显著性水平和自由度0t (n-3)查t表可得到临界值 Ft (二)模型整体的F检验 检验统计量:(k自变量个数) 二元线性回归模型下统计量: 或 按给定的和自由度(2)和(n-3)查F表可得

9、到临界值F(2,n-3)0F(n,m)四、多元回归中的相关分析 (一)复相关 指一个因变量同多个自变量的相关关系。 复相关系数 恒取正值。 (二)偏相关(净相关) 指各个自变量在其他自变量固定不变时,单个变量同因变量的相关关系。 计算偏相关系数需借助相关系数矩阵表的资料。二元回归中的相关系数矩阵表yx1x2y1.00x1ry11.00x2ry2r121.00 x1与y的偏相关系数: x2与y的偏相关系数: 偏相关系数与单相关系数符号相同,但数值不同。第五节 非线性回归模型 当自变量与因变量存在某种曲线相关关系时,可拟合曲线回归模型。例如:yy 双曲线: xa0, b00a0 b0x0指数曲线:

10、y=aebxy b0x b0x幂函数曲线:y=axb a0, b000x a0, b0 曲线模型的判别方法: (1)理论和经验判断;(2)观察散点图 曲线模型的确定方法: 通常用变量代换法将曲线转换为直线。按线性模型 求解参数,而后再变换为曲线模型。 例如:双曲线模型: 指数曲线模型 小 结一、相关与回归的系统分析n对样本数据 相关分析 回归分析 求r 建立模型 t检验 r2评价 Sxy检验 t F对变量本质关系的解释与区间估计(预测)二、注意问题 1注意相关分析和回归分析的联系和区别,正确地把它们结合起来; 2正确理解相关和回归分析中各种测定方法的意义和解释计算的结果; 3选择恰当的回归方程,避免方程形式的错误识别; 4避免多重共线性,即避免自变量之间的高度相关; 5避免因变量的序列相关的影响。 6把定性分析与定量分析结合起来,不能轻易地把统计上的相关关系都解释为因果关系。 7回归模型用于外推预测要谨慎。14

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1