第五章相关与回归分析完整版.ppt

上传人:本田雅阁 文档编号:2625191 上传时间:2019-04-21 格式:PPT 页数:162 大小:7.42MB
返回 下载 相关 举报
第五章相关与回归分析完整版.ppt_第1页
第1页 / 共162页
第五章相关与回归分析完整版.ppt_第2页
第2页 / 共162页
第五章相关与回归分析完整版.ppt_第3页
第3页 / 共162页
亲,该文档总共162页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第五章相关与回归分析完整版.ppt》由会员分享,可在线阅读,更多相关《第五章相关与回归分析完整版.ppt(162页珍藏版)》请在三一文库上搜索。

1、5 - 1 统计统计 学 第 5 章 相关与回归分析 统计学 5 - 2 统计统计 学 第5章 相关与回归分析 5.1 相关与回归分析的基本概念 5.2 一元线性回归分析 5.3 多元线性回归分析 5.4 非线性回归分析 5.5 相关分析 5 - 3 统计统计 学学习目标 1. 了解相关与回归分析的基本概念 掌握一元线性回归的基本原理和参数的最小二 乘估计 掌握回归直线的拟合优度测定 掌握回归系数和回归方程的显著性检验 利用回归方程进行估计和预测 用 Excel ,SPSS进行回归 掌握各种相关系数的含义和应用场合 5 - 4 统计统计 学 5.1 相关与回归分析的基本概念 一. 函数关系与相

2、关关系 二. 相关关系的种类 三. 相关分析和回归分析 四. 相关表和相关图 5 - 5 统计统计 学 函数关系和相关关系 5 - 6 统计统计 学函数关系 是一一对应的确定关系 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完 全依赖于 x ,当变量 x 取某 个数值时, y 依确定的关系 取相应的值,则称 y 是 x 的 函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 各观测点落在一条线上 x x y y 5 - 7 统计统计 学 函数关系 (几个例子) 函数关系的例子函数关系的例子 某种商品的销售额某种商品的销售额( (y y) )与销售量与销售量(

3、 (x x) )之间的关系可之间的关系可 表示为表示为 y y = = pxpx ( (p p 为单价为单价) ) 圆的面积圆的面积( (S)S)与半径之间的关系可表示为与半径之间的关系可表示为S S= = R R2 2 企业的原材料消耗额企业的原材料消耗额( (y y) )与产量与产量( (x x 1 1 ) ) 、单位产量单位产量 消耗消耗( (x x 2 2 ) ) 、原材料价格原材料价格( (x x 3 3 ) )之间的关系可表示为之间的关系可表示为 y y = = x x 1 1 x x2 2 x x3 3 5 - 8 统计统计 学 相关关系 (correlation) 变量间关系不

4、能用函数关 系精确表达 一个变量的取值不能由另 一个变量唯一确定 当变量 x 取某个值时,变 量 y 的取值可能有几个 各观测点分布在直线周围 x x y y 5 - 9 统计统计 学 相关关系 (几个例子) 相关关系的例子相关关系的例子 父亲身高父亲身高( (y y) )与子女身高与子女身高( (x x) )之间的关系之间的关系 收入水平收入水平( (y y) )与受教育程度与受教育程度( (x x) )之间的关系之间的关系 粮食亩产量粮食亩产量( (y y) )与施肥量与施肥量( (x x 1 1 ) ) 、降雨量降雨量( (x x 2 2 ) ) 、 温度温度( (x x 3 3 ) )

5、之间的关系之间的关系 商品的消费量商品的消费量( (y y) )与居民收入与居民收入( (x x) )之间的关系之间的关系 商品销售额商品销售额( (y y) )与广告费支出与广告费支出( (x x) )之间的关系之间的关系 5 - 10 统计统计 学 相关关系 (类型) 5 - 11 统计统计 学 相关关系 (类型) 按变量多少可分为 n简单相关 n多元相关 复相关 偏相关 按依存形式可分为 n线性相关 n非线性相关 5 - 12 统计统计 学 相关关系 (类型) 3. 按相关的程度可分为 n完全相关 n不完全相关 n完全无关 4. 按相关的方向可分为 n正相关 n负相关 5 - 13 统计

6、统计 学 相关分析与回归分析 5 - 14 统计统计 学 相关分析与回归分析 相关分析:分析现象之间相互依存关系的密 切程度. 回归分析:根据相关关系的具体形态,选择 一个合适的数学模型,来近似地表达变量间 平均变化关系. 5 - 15 统计统计 学 相关关系的描述与测度 (相关表和散点图) 5 - 16 统计统计 学 散点图 (scatter diagram) 不相关不相关 负线性相关负线性相关 正线性相关正线性相关 非线性相关非线性相关 完全负线性相关完全负线性相关完全正线性相关完全正线性相关 5 - 17 统计统计 学 散点图 (例题分析) 【例】一家大型商业银行在多个地区设有分行 ,其

7、业务主要是进行基础设施建设、国家重 点项目建设、固定资产投资等项目的贷款。 近年来,该银行的贷款额平稳增长,但不良 贷款额也有较大比例的提高,这给银行业务 的发展带来较大压力。为弄清楚不良贷款形 成的原因,希望利用银行业务的有关数据做 些定量分析,以便找出控制不良贷款的办法 。下面是该银行所属的25家分行2002年的有 关业务数据 5 - 18 统计统计 学 散点图 (例题分析) 5 - 19 统计统计 学 散点图 (例题分析) 5 - 20 统计统计 学5.2 一元线性回归 一. 一元线性回归模型 二. 参数的最小二乘估计 三. 回归直线的拟合优度 四. 显著性检验 5 - 21 统计统计

8、学 什么是回归分析? (Regression) 从一组样本数据出发,确定变量之间的数学 关系式 对这些关系式的可信程度进行各种统计检验 ,并从影响某一特定变量的诸多变量中找出 哪些变量的影响显著,哪些不显著 利用所求的关系式,根据一个或几个变量的 取值来预测或控制另一个特定变量的取值, 并给出这种预测或控制的精确程度 回归一词是回归一词是 怎么来的怎么来的? ?? 5 - 22 统计统计 学 回归分析与相关分析的区别 相关分析中,变量 x 变量 y 处于平等的地 位;回归分析中,变量 y 称为因变量,处 在被解释的地位,x 称为自变量,用于预 测因变量的变化 相关分析主要是描述两个变量之间依存

9、关 系的密切程度;回归分析不仅可以揭示变 量 x 对变量 y 的影响大小,还可以由回归 方程进行预测和控制 5 - 23 统计统计 学 回归模型的类型 5 - 24 统计统计 学 一元线性回归模型 5 - 25 统计统计 学 一元线性回归 涉及一个自变量的回归 因变量y与自变量x之间为线性关系 n被预测或被解释的变量称为因变量 (dependent variable),用y表示 n用来预测或用来解释因变量的一个或多个变 量称为自变量(independent variable),用x 表示 因变量与自变量之间的关系用一条线性方 程来表示 5 - 26 统计统计 学 回归模型 (regressio

10、n model) 回答“变量之间是什么样的关系?” 方程中运用 n1 个数字的因变量(响应变量) l被预测的变量 n1 个或多个数字的或分类的自变量 (解释变量) l用于预测的变量 3. 主要用于预测和估计 5 - 27 统计统计 学 一元线性回归模型 描述因变量 y 如何依赖于自变量 x 和误差项 的 方程称为回归模型 一元线性回归模型可表示为 y = b0 + b1 x + e ny 是 x 的线性函数(部分)加上误差项 n线性部分反映了由于 x 的变化而引起的 y 的变化 n误差项 是随机变量 l反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的 影响 l是不能由 x 和 y

11、之间的线性关系所解释的变异性 n 0 和 1 称为模型的参数(回归系数) 5 - 28 统计统计 学 一元线性回归模型 (基本假定) 误差项是一个期望值为0的随机变量,即E()=0 。对于一个给定的 x 值,y 的期望值为E ( y ) = 0+ 1 x 对于所有的 x 值,的方差2 都相同 误差项是一个服从正态分布的随机变量,且相 互独立。即N( 0 ,2 ) n独立性意味着对于一个特定的 x 值,它所对应的与 其他 x 值所对应的不相关 n对于一个特定的 x 值,它所对应的 y 值与其他 x 所 对应的 y 值也不相关 5 - 29 统计统计 学 回归方程 (regression equa

12、tion) 描述 y 的平均值或期望值如何依赖于 x 的方程 称为回归方程 一元线性回归方程的形式如下 E( y ) = 0+ 1 x(总体回归直线 ) 方程的图示是一条直线,也称为直线回归方程方程的图示是一条直线,也称为直线回归方程 0 0 是回归直线在是回归直线在 y y 轴上的截距,是当轴上的截距,是当 x x=0 =0 时时 y y 的期的期 望值望值 1 1 是直线的斜率,称为回归系数,表示当是直线的斜率,称为回归系数,表示当 x x 每变动每变动 一个单位时,一个单位时,y y 的平均变动值的平均变动值 5 - 30 统计统计 学 估计的回归方程 (estimated regres

13、sion equation) 3.3. 一元线性回归中估计的回归方程一元线性回归中估计的回归方程( (样本回归直线样本回归直线 ) ) 为为 2.2. 用用样本统计量样本统计量 和和 代替回归方程中的未知参代替回归方程中的未知参 数数 和和 ,就得到了,就得到了估计的回归方程估计的回归方程 1.1. 总体总体回归参数回归参数 和和 是未知的,必需利用样本数是未知的,必需利用样本数 据去估计据去估计 其中:其中: 是估计的回归直线在是估计的回归直线在 y y 轴上的截距,轴上的截距, 是直线是直线 的斜率,它表示对于一个给定的的斜率,它表示对于一个给定的 x x 的值,的值, 是是 y y 的估

14、计的估计 值,也表示值,也表示 x x 每变动一个单位时,每变动一个单位时, y y 的平均变动值的平均变动值 5 - 31 统计统计 学 参数的最小二乘估计 5 - 32 统计统计 学 最小二乘估计 1.1. 使因变量的观察值与估计值之间的离差平方和使因变量的观察值与估计值之间的离差平方和 达到最小来求得达到最小来求得 和和 的方法。即的方法。即 2.2. 用最小二乘法拟合的直线来代表用最小二乘法拟合的直线来代表x x与与y y之间之间的的 关系与实际数据的误差比其他任何直线都小关系与实际数据的误差比其他任何直线都小 5 - 33 统计统计 学 最小二乘估计 (图示) x x y y ( (

15、x xn n , , y y n n ) ) ( (x x1 1 , , y y 1 1 ) ) ( (x x2 2 , , y y 2 2 ) ) ( (x xi i , , y y i i ) ) e ei i = = y y i i - -y y i i 5 - 34 统计统计 学 最小二乘法 ( 和 的计算公式) 根据最小二乘法的要求,可得求解根据最小二乘法的要求,可得求解 和和 的公的公 式如下式如下 5 - 35 统计统计 学 估计方程的求法 (例题分析) 【例】求不良贷款对贷款余额的回归方程 回归方程为:回归方程为:y = y = -0.8295 -0.8295 + + 0.03

16、7895 0.037895 x x 回归系数回归系数 =0.037895 =0.037895 表示,贷款余额每增表示,贷款余额每增 加加1 1亿元,不良贷款平均增加亿元,不良贷款平均增加0.0378950.037895亿元亿元 5 - 36 统计统计 学 估计方程的求法 (例题分析) 不良贷款对贷款余额回归方程的图示 5 - 37 统计统计 学 用Excel进行回归分析 第1步:选择“工具”下拉菜单 第2步:选择“数据分析”选项 第3步:在分析工具中选择“回归”,然后选择“确定” 第4步:当对话框出现时 在“Y值输入区域”方框内键入Y的数据区域 在“X值输入区域”方框内键入X的数据区域 在“置

17、信度”选项中给出所需的数值 在“输出选项”中选择输出区域 在“残差”分析选项中选择所需的选项 用Excel进行回归分析 5 - 38 统计统计 学 回归直线的拟合优度 5 - 39 统计统计 学 变差 因变量 y 的取值是不同的,y 取值的这种 波动称为变差。变差来源于两个方面 n由于自变量 x 的取值不同造成的 n除 x 以外的其他因素(如x对y的非线性影响、 测量误差等)的影响 对一个具体的观测值来说,变差的大小可 以通过该实际观测值与其均值之差 来 表示 5 - 40 统计统计 学 变差的分解 (图示) x x y y y 5 - 41 统计统计 学 离差平方和的分解 (三个平方和的关系

18、) SSTSST = = SSRSSR + + SSESSE 总平方和总平方和 ( (SSTSST) ) 回归平方和回归平方和 ( (SSRSSR) ) 残差平方和残差平方和 ( (SSESSE) ) 5 - 42 统计统计 学 离差平方和的分解 (三个平方和的意义) 总平方和(SST) n反映因变量的 n 个观察值与其均值的总离差 回归平方和(SSR) n反映自变量 x 的变化对因变量 y 取值变化的影 响,或者说,是由于 x 与 y 之间的线性关系引 起的 y 的取值变化,也称为可解释的平方和 残差平方和(SSE) n反映除 x 以外的其他因素对 y 取值的影响,也 称为不可解释的平方和或

19、剩余平方和 5 - 43 统计统计 学 判定系数r2 (coefficient of determination) 回归平方和占总离差平方和的比例 2.2. 反映回归直线的拟合程度反映回归直线的拟合程度 3.3. 取值范围在取值范围在 0 , 1 0 , 1 之间之间 4.4. R R 2 2 1 1,说明回归方程拟合的越好;说明回归方程拟合的越好;R R 2 2 0 0 ,说明回归方程拟合的越差说明回归方程拟合的越差 5.5. 一元线性回归中,判定一元线性回归中,判定系数等于相关系数系数等于相关系数 的平方,即的平方,即R R 2 2 ( (r r) ) 2 2 5 - 44 统计统计 学

20、判定系数r2 (例题题分析) 【例】计算不良贷款对贷款余额回归的判定系数,并解 释其意义 判定系数的实际意义是:在不良贷款取值的变差中 ,有71.16%可以由不良贷款与贷款余额之间的线性 关系来解释,或者说,在不良贷款取值的变动中, 有71.16%是由贷款余额所决定的。也就是说,不良 贷款取值的差异有2/3以上是由贷款余额决定的。可 见不良贷款与贷款余额之间有较强的线性关系 5 - 45 统计统计 学 估计标准误差 (standard error of estimate) 实际观察值与回归估计值离差平方和的均方根 反映实际观察值在回归直线周围的分散状况 对误差项 的标准差 的估计,是在排除了x

21、对y 的线性影响后,y随机波动大小的一个估计量 反映用估计的回归方程预测y时预测误差的大小 计算公式为 注:例题的计算结果为注:例题的计算结果为1.97991.9799 5 - 46 统计统计 学 显著性检验 5 - 47 统计统计 学 线性关系的检验 检验自变量与因变量之间的线性关系是否 显著 将回归均方(MSR)同残差均方(MSE)加以 比较,应用F检验来分析二者之间的差别是 否显著 回归均方:回归平方和SSR除以相应的自由 度(自变量的个数p) 残差均方:残差平方和SSE除以相应的自由 度(n-p-1) 5 - 48 统计统计 学 线性关系的检验 (检验的步骤) 提出假设 nH0: 1=

22、0 线性关系不显著 2. 2. 计算计算检验统计量检验统计量F F 3.3. 确定确定显著性水平显著性水平 ,并根据分子自由度,并根据分子自由度1 1和分和分 母自由度母自由度n n-2-2找出找出临界值临界值F F 4.4. 作作出决策:若出决策:若F F F F , ,拒绝 拒绝H H0 0; ;若 若F F F F , ,拒绝 拒绝H H 0 0 ,线性关系显著线性关系显著 5 - 50 统计统计 学 线性关系的检验 (方差分析表) Excel Excel 输出的方差分析表输出的方差分析表 5 - 51 统计统计 学 回归系数的检验 3.3. 在一元线性回归中,等价于线性关系的在一元线性

23、回归中,等价于线性关系的 显著性检验显著性检验 1.1. 检验检验 x x 与与 y y 之间是否具有线性关系,或之间是否具有线性关系,或 者说,检验自变量者说,检验自变量 x x 对因变量对因变量 y y 的影响的影响 是否显著是否显著 2.2. 理论基础是回归系数理论基础是回归系数 的抽样分布的抽样分布 5 - 52 统计统计 学 回归系数的检验 (样本统计量 的分布) 1.1. 是根据最小二乘法求出的样本统计量,它有自是根据最小二乘法求出的样本统计量,它有自 己的分布己的分布 2.2. 的的分布具有如下性质分布具有如下性质 分布形式:正态分布分布形式:正态分布 数学期望:数学期望: 标准

24、差:标准差: 由于由于 未知,需用其估计量未知,需用其估计量 s sy y 来代替得到来代替得到 的估计的标的估计的标 准差准差 5 - 53 统计统计 学 回归系数的检验 (检验步骤) 提出假设 nH0: b1 = 0 (没有线性关系) nH1: b1 0 (有线性关系) 计算检验的统计量 3.3. 确定显著性水平确定显著性水平 ,并进行决策,并进行决策 t t t t ,拒绝拒绝H H 0 0 ; t t =7.533515t t =2.201=2.201,拒绝拒绝H H 0 0 ,表明表明不良贷不良贷 款与贷款余额之间有线性关系款与贷款余额之间有线性关系 5 - 55 统计统计 学 回归

25、系数的检验 (例题分析) P 值的应用 P P=0.000000 F F , ,拒绝拒绝H H 0 0 Excel Excel 输出输出 结果的分析结果的分析 5 - 105 统计统计 学 回归系数的检验 线性关系检验通过后,对各个回归系数有选 择地进行一次或多次检验 究竟要对哪几个回归系数进行检验,通常需 要在建立模型之前作出决定 对回归系数检验的个数进行限制,以避免犯 过多的第一类错误(弃真错误) 对每一个自变量都要单独进行检验 应用 t 检验统计量 5 - 106 统计统计 学 回归系数的检验 (步骤) 提出假设 nH0: bi = 0 (自变量 xi 与 因变量 y 没有线性关系) n

26、H1: bi 0 (自变量 xi 与 因变量 y有线性关系) 计算检验的统计量 t 3.3. 确定显著性水平确定显著性水平 ,并进行决策,并进行决策 t t t t ,拒绝拒绝H H 0 0 ; t t t(25- 2)=2.0687,所以均拒绝原假设,说明这4个自变量 两两之间都有显著的相关关系 由表Excel输出的结果可知,回归模型的线性关系显 著(Significance-F1.03539E-06 =0.05) 。这也暗示了模型中存在多重共线性 固定资产投资额的回归系数为负号(-0.029193) ,与 预期的不一致 5 - 114 统计统计 学 多重共线性 (问题的处理) 将一个或多个

27、相关的自变量从模型中剔除 ,使保留的自变量尽可能不相关 如果要在模型中保留所有的自变量,则应 n避免根据 t 统计量对单个参数进行检验 n对因变量值的推断(估计或预测)的限定在自 变量样本值的范围内 Excel Excel 输出结果的分析输出结果的分析 5 - 115 统计统计 学 利用回归方程进行估计和预测(软件 应用) 5 - 116 统计统计 学 置信区间估计 (例题分析) STATISTICA输出的不良贷款的置信区间 5 - 117 统计统计 学 预测区间估计 (例题分析) STATISTICA输出的不良贷款的预测区间 5 - 118 统计统计 学 含有一个虚拟自变量的回归 5 - 1

28、19 统计统计 学 虚拟自变量 (dummy variable) 用数字代码表示的定性自变量 虚拟自变量可有不同的水平 n只有两个水平的虚拟自变量 l比如,性别(男,女) n有两个以上水平的虚拟自变量 l贷款企业的类型(家电,医药,其他) 虚拟变量的取值为0,1 5 - 120 统计统计 学 虚拟自变量的回归 回归模型中使用虚拟自变量时,称为虚拟自变 量的回归 当虚拟自变量只有两个水平时,可在回归中引 入一个虚拟变量 n比如,性别(男,女) 一般而言,如果定性自变量有k个水平,需要在 回归中模型中引进k-1个虚拟变量 5 - 121 统计统计 学 虚拟自变量的回归 (例题分析) 【例】【例】为

29、研究为研究 考试成绩与性考试成绩与性 别之间的关系别之间的关系 ,从某大学商,从某大学商 学院随机抽取学院随机抽取 男女学生各男女学生各8 8 名,得到他们名,得到他们 的市场营销学的市场营销学 课程的考试成课程的考试成 绩如下表绩如下表 5 - 122 统计统计 学 虚拟自变量的回归 (例题分析) 散点图散点图 y y与与x x的回归的回归 男 女 5 - 123 统计统计 学 虚拟自变量的回归 (例题分析) 引进虚拟变量时,回归方程可写:E(y) = 0+ 1x 男( x=0):E(y) = 0男学生考试成绩的期望值 女(x=0 ):E(y) = 0+ 11女学生考试成绩的期望 值 注意:

30、当指定虚拟变量01时 0总是代表与虚拟变量值0所对应的那个分类变量水 平的平均值 1总是代表与虚拟变量值1所对应的那个分类变量水 平的平均响应与虚拟变量值0所对应的那个分类变量 水平的平均值的差值,即 平均值的差值 =( 0+ 1) - 0= 1 5 - 124 统计统计 学 虚拟自变量的回归 (例题分析) 【例】【例】为研为研 究工资水平究工资水平 与工作年限与工作年限 和性别之间和性别之间 的关系,在的关系,在 某行业中随某行业中随 机抽取机抽取1010名名 职工,所得职工,所得 数据如下表数据如下表 y y与与x x 1 1 的回归及分析的回归及分析 y y与与x x 1 1 、 x x

31、 2 2 的回归及分析的回归及分析 5 - 125 统计统计 学 虚拟自变量的回归 (例题分析) 引进虚拟变量时,回归方程可写: E(y) = 0+ 1x1+ 2x2 女( x2=0):E(y|女性) = 0 +1x1 男(x2=1):E(y|男性) =( 0 + 2 ) +1x1 0的含义表示:女性职工的期望月工资收入 ( 0+ 2)的含义表示:男性职工的期望月工资收入 1含义表示:工作年限每增加1年,男性或女性工资 的平均增加值 2含义表示:男性职工的期望月工资收入与女性职 工的期望月工资收入之间的差值 ( 0+ 2) - 0= 2 5 - 126 统计统计 学5.4 非线性回归 一. 非

32、线性回归分析简介 二. 常见的可线性化的非线性函数 三. 非线性回归分析的注意事项 5 - 127 统计统计 学 非线性回归分析简介 5 - 128 统计统计 学非线性回归的意义 在实际工作中,有时变量之间相关关系并 非存在线性关系,而呈诸如抛物线、指 数曲线、双曲线等各种各样的非线性关 系。需要应用适当形式的曲线回归方程 来描述它们之间的关系。这种为观察数 据拟合曲线回归方程所进行的分析,称 为非线性回归分析。 5 - 129 统计统计 学非线性回归分析的一般步骤 先对所研究的现象进行理论分析,分析现象 之间是否确实存在相关关系 确定相关的形式,可结合观察散点图的分布 ,确定拟合哪种形式的曲

33、线较为合适 计算其有关参数,从而确定所拟合的回归方 程形式 比较可决系数(或相关指数)及估计的标准 误差等指标来选择合适的回归模型,并根据 所确定的回归方程进行预测。 5 - 130 统计统计 学非线性函数形式的确定 首先,方程形式应与所要研究现象相一 致,例如生产函数多用幂函数的形式; 而总成本与总产量之间的关系多呈多项 式关系 其次,选择有较高拟合程度的方程 最后,方程的数学形式要尽可能的简单 (准确性和可操作性更高) 5 - 131 统计统计 学非线性回归模型的参数估计 非线性回归方程的参数估计方法有多种, 比较简单常用的有: 非线性最小二乘法 化为线性模型(采用简单数学变换或泰 勒级数

34、展开等),再用线性最小二乘法 5 - 132 统计统计 学 常见的可线性化的非线性函数 5 - 133 统计统计 学常见的可线性化的函数 抛物线: 特征:二阶差分为常数 双曲线函数: 5 - 134 统计统计 学常见的可线性化的函数 幂函数 特征: Y对Xj的弹性为bj,常用于生产函数 和需求函数 5 - 135 统计统计 学常见的可线性化的函数 指数函数: 常用于描述增长速度大致相等的时间序列 曲线 对数函数: 常见初等函数曲线 5 - 136 统计统计 学常见的可线性化的函数 S型曲线: 特征:开始时,Y随X的增加而递增的增加,当Y 达到一定水平时,Y随X增加而递减的增加, 并以X=L为渐

35、近线常用于描述生长曲线或用 来表现耐用消费品普及率的变化 5 - 137 统计统计 学 非线性回归分析的注意事项 5 - 138 统计统计 学非线性回归分析的注意事项 当模型中只有变量是非线性,而参数估计量 及Y的估计量是关于误差项的线性函数时 , 我们称该模型具有内在线型性 当模型不具有内在线型性时 不能从回归残差中得到随机项方差的无偏估计量 由于回归系数的估计量不再是随机项的线性函数 ,t检验和F检验都失效 由于Y的估计量不再是随机项的线性函数,因此 , Y的估计量不再具有最佳、线性、无偏的性质 ,置信区间也无法构造 5 - 139 统计统计 学5.5 相关分析 一. 线性单相关分析 二.

36、 等级相关系数及其检验 三. 复相关系数与偏相关系数 四. 相关指数 5 - 140 统计统计 学 线性单相关分析(Pearson 相关系 数) 5 - 141 统计统计 学 简单线性相关系数 (Pearson correlation coefficient) 对变量之间关系密切程度的度量 对两个变量之间线性相关程度的度量称为 简单线性相关系数,简称相关系数 若相关系数是根据总体全部数据计算的, 称为总体相关系数,记为 若是根据样本数据计算的,则称为样本相 关系数,记为 r 5 - 142 统计统计 学 简单线性相关系数 (总体) 总体相关系数的计算公式 5 - 143 统计统计 学 简单线性

37、相关系数 (计算公式) 样本相关系数的计算公式 或或化简为化简为 5 - 144 统计统计 学 相关系数 (取值及其意义) r 的取值范围是 -1,1 |r|=1,为完全相关 nr =1,为完全正相关 nr =-1,为完全负正相关 r = 0,不存在线性相关关系相关 -1 r t t ,拒绝拒绝H H 0 0 若若 t t =7.5344t t (25-2)=2.0687(25-2)=2.0687,拒绝拒绝H H 0 0 ,不不 良贷款与贷款余额之间存在着显著的正线性相关良贷款与贷款余额之间存在着显著的正线性相关 关系关系 5 - 151 统计统计 学 相关系数的显著性检验 (例题分析) 各相

38、关系数检验的统计量 5 - 152 统计统计 学 等级相关分析 (Spearman等级相关系数) 5 - 153 统计统计 学 Spearman等级相关系数 (Spearman correlation coefficient) 两个变量中有一个变量或两个变量都为定 序变量时,不可以用Pearson相关系数, 而应该用Spearman 等级相关系数或 Kendall和谐系数 即使两个变量都为定距或定比变量,当两 个变量的相关形式不表现为线性关系时, 有时可以表现为等级相关 5 - 154 统计统计 学 Spearman等级相关系数 (计算公式) Spearman等级相关系数 其中,其中,d d

39、i i (x x i i - -y y j j ), ),x x i i 和和y y j j 分别是两个变量按分别是两个变量按 大小排列的等级,大小排列的等级,n n为样本容量为样本容量 SpearmanSpearman等级相关系数与等级相关系数与PearsonPearson相关系相关系 数具有类似的性质和相关检验方法数具有类似的性质和相关检验方法 等级相等级相 关例题关例题 5 - 155 统计统计 学 复相关系数与偏相关系数 5 - 156 统计统计 学 复相关系数 复相关系数:反映一个变量y与其它多个变量 之间线性相关程度的指标 式中用式中用 代替代替x x x x x x k k ,

40、, 应用时多用多应用时多用多 元线性回归方程的可决系数的根号直接求元线性回归方程的可决系数的根号直接求 得,其值介于到之间,无正负之分得,其值介于到之间,无正负之分 5 - 157 统计统计 学 偏相关系数 偏相关系数:在对其他变量的影响进行 控制的条件下,衡量多个变量中某两个变 量之间的线性相关程度。 例如收集南京市80年至2006年的牛奶消费 量和价格资料会发现牛奶的消费量随价格 上涨而增加的伪相关现象,解释是因为人 们的收入增加,所以,应该计算在收入不变 的情况下消费量和价格的关系,即偏相关 系数。 5 - 158 统计统计 学 偏相关系数 设有k个变量x x xk, ,则第一个变量与

41、第j个变量间的偏相关系设数为例题 式中式中 是是Y Y对对X X j j 的偏回归系数的偏回归系数 是是X X j j 对对Y Y的偏回归系数的偏回归系数 5 - 159 统计统计 学 相关指数 5 - 160 统计统计 学 相关指数 相关指数:判断变量之间是否显著存在某种 类型的非线性相关关系的尺度,即对非线 性回归模型进行拟合时所得到的可决系数 相关指数例题 5 - 161 统计统计 学本章小结(要求) 了解相关分析和回归分析的含义,步骤 掌握一元回归模型、回归方程、估计方程方程 的拟合优度,回归显著性检验,利用回归方程 进行估计和预测 了解多元回归模型相关分析,掌握调整的可决 系数的意义,了解多重共线性 掌握可线性化的常见非线性函数形态和线性化 的方法,了解非线性回归的注意事项 掌握各种相关系数的意义和应用场合,掌握 Pearson相关系数的计算 会用EXCEL,SPSS进行相关和回归分析 结 束

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1