第二章多元回归分析.ppt

上传人:本田雅阁 文档编号:2968526 上传时间:2019-06-15 格式:PPT 页数:53 大小:778.54KB
返回 下载 相关 举报
第二章多元回归分析.ppt_第1页
第1页 / 共53页
第二章多元回归分析.ppt_第2页
第2页 / 共53页
第二章多元回归分析.ppt_第3页
第3页 / 共53页
第二章多元回归分析.ppt_第4页
第4页 / 共53页
第二章多元回归分析.ppt_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《第二章多元回归分析.ppt》由会员分享,可在线阅读,更多相关《第二章多元回归分析.ppt(53页珍藏版)》请在三一文库上搜索。

1、第三章 多元线性回归,3.1 多元线性回归模型 3.2 回归方程的拟合优度 3.3 显著性检验 3.4 多重共线性 3.5 利用回归方程进行估计和预测 3.6 虚拟自变量的回归,3.1 多元线性回归模型,一、多元回归模型与回归方程 二、估计的多元回归方程 三、参数的最小二乘估计,一、多元回归模型与回归方程,1.多元回归模型(multiple regression model),多元线性回归模型误差项的基本假定,2.多元回归方程(multiple regression equation),多元线性回归方程的直观解释,二、估计的多元回归的方程,三、参数的最小二乘估计,续,根据微积分中求极值的原理,

2、 应是下列正规方程组的解,例3.1,一家大型商业银行在多个地区设有分行,为弄清楚不良贷 款形成的原因,抽取了该银行所属的25家分行2002年的有关业 务数据(表2-1). 试建立不良贷款(y)与贷款余额(x1)、累计应收贷款 (x2)、贷款项目个数 (x3) 和固定资产投资额 (x4) 的线性回归方程,并解释各回归系数的含义. 解:由 Excel 给出的多元回归结果见表12-2. 得不良贷款(y) 与贷款余额 (x1)、累计应收贷款 (x2)、贷款项目个数(x3) 和固定资产投资额 (x4) 的线性回归方程如下,表3-1,某商业银行2002年的有关业务数据,用Excel进行回归分析的步骤,表3

3、-2,Excel输出的回归分析结果,3.2 回归方程的拟合优度,一、多重判定系数 二、估计标准误差,一、多重判定系数(multiple coefficient of determination),续,修正多重判定系数(adjusted multiple coefficient of determination),例,根据例12.1的数据,计算多重判定系数. 解:根据(13.7)式,得,而根据(13.8)式,则,二、估计标准误差(standard error of estimate),3.3 显著性检验,一、线性关系检验 二、回归系数检验和推断,一、线性关系检验,方差分析表,前面的这些计算结果可

4、以列成表格的形式,称为方差分析表. 方差分析表,根据例 3.1 建立的回归方程,检验线性关系的显著性. 解:提出假设,例3.2,二、回归系数检验和推断,1.当回归方程显著时,仅表示 中至少有一个 不为 0 ,即并不表示每一个自变量对因变量的影响一定都是显 著的. 2.回归系数的显著性则是对每一个自变量都要检验,从而 确定每一个自变量对因变量的影响是否显著. 3.采用 t 检验 4.对于多元线性回归,回归系数的显著性检验与回归方程 的显著性检验是两种不同的检验方法.,回归系数的显著性检验步骤,续,例3.3,根据例 3.1 建立的回归方程,检验每一个自变量对因变 量的影响是否显著. 解:根据表3-

5、2,得,回归系数的置信区间,3.4 多重共线性,一、多重共线性及其所产生的问题 二、多重共线性的判别 三、多重共线性问题的处理,一、多重共线性及其所产生的问题,1. 当自变量之间线性相关时,称自变量存在多重共线性. 2. 自变量存在多重共线性时,使 的方差增大,从而使 的取值变动大,甚至会出现反常值.,1.当自变量之间线性相关时,称自变量存在多重共线性. 2.自变量存在多重共线性时,使 的方差增大,从而使 的取值变动大,甚至会出现反常值.,二、多重共线性的判别,检测多重共线性的最简单的一种办法是计算自变量之间的 相关系数并进行显著性检验. 若有一个或多个相关系数显著, 则表明自变量之间线性相关

6、,即存在着多重共线性.,例3.4,根据例 3.1 的数据,检验自变量是否存在多重共线性. 表3-3 自变量之间的相关矩阵,表3-4,相关系数的 t 检验统计量,三、多重共线性问题的处理,剔除紧密相关且不重要的自变量,从而尽可能使自变量之 间线性无关.,例3.5,根据例 3.1 的数据,对多重共线性进行处理. 解:由于 最小,首先剔除 ,建立 y 与 的回归方程. 又由于这时 最小,且 不显著. 从而再剔除 ,建立 y 与 的回归方程. 这时, 都是显著.,包含x1、x2和 x4 的回归方程,表 35,包含x1和 x4 的回归方程,3.5 利用回归方程进行估计和预测,区间预测,对于自变量的一组取

7、值 根据样本回归方程给出 或 的一个估计区间,称为置信区间. 由于置信区间和预测区间的计算较复杂,这里我们直接给出结果:,例3.6,根据例 3.1 的数据,贷款余额 x1=100 、累计应收贷款 x2=10、贷款项目个数 x3=15 和固定资产投额 x4=60 ,试给出 不良贷款的0.95置信区间和预测区间. 解:可以计算 点估计为2.929. 置信区间 : 2.04,3.80 置信区间: 【-0.88,6.72】,3.6 虚拟自变量的回归,一、含有一个虚拟自变量的回归 二、用虚拟自变量回归解决方差分析问题,一、含有一个虚拟自变量的回归,如果一个定性的自变量只划分为两个类别,并分别用 0 和

8、1 表示,这种定性变量称为虚拟自变量. 回归模型中使用虚拟自变量时,称为虚拟自变量的回归.当一个定性的自变量划分为 k (2)个类别时,则可转化为 k 个虚拟自变量,但只能引进 k-1 个虚拟自变量.,例3.7,为研究考试成绩与性别之间的关系,从某大学商学院随机 抽取男女学生各8名,得到他们的市场营销学课程的考试成绩列于表3-8. 试建立考试成绩与性别的线性回归方程. 解:学生性别是一个定性变量,分别用 0 和 1 表示男性和女性,即,由 Excel 给出的结果如表2-9所示.,,男性 ,女性,表3-8,16名学生的市场营销学课程考试成绩,用Excel进行虚拟自变量的回归分析的步骤,表3-9,

9、Excel 给出的回归分析结果,例3.8,为研究工资水平与工作年限和性别之间的关系,在某行业随机抽取10名职工,所得数据如下. 表3-10 10名职工的工资水平、工作年限和性别的数据,表3-11,月工资收入(y)与工作年限(x1)的回归结果,续,首先,考虑只有数值型自变量(工作年限)的一元回归. 由 Excel 给出的回归结果如表 3-11 所示. 回归方程显著,R2= 0.5342. 再引进虚拟自变量(性别),即,,男性 ,女性,得包含虚拟自变量的数据表3-12如下.,表3-12,10名职工的工资水平、工作年限和性别的数据,续,表3-13,月工资收入(y)与工作年限 、性别 的回归结果,作业与思考:,1、对于线性统计模型 假设,最小化误差平方和得到如下线性方程组,(1)把这个方程组写成矩阵的形式,并利用矩阵方法求最小二乘估计量b的值。 (2)如果 的无偏估计量s2的值。 (3)求b的协方差矩阵。 (4) 分别写出能够检验 的t统计量(k=1,2,3)。 (5)写出能够检验 的t 统计量和F统计量。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1