第2讲放松经典模型的假定.ppt

上传人:本田雅阁 文档编号:2601005 上传时间:2019-04-16 格式:PPT 页数:127 大小:5.73MB
返回 下载 相关 举报
第2讲放松经典模型的假定.ppt_第1页
第1页 / 共127页
第2讲放松经典模型的假定.ppt_第2页
第2页 / 共127页
第2讲放松经典模型的假定.ppt_第3页
第3页 / 共127页
亲,该文档总共127页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第2讲放松经典模型的假定.ppt》由会员分享,可在线阅读,更多相关《第2讲放松经典模型的假定.ppt(127页珍藏版)》请在三一文库上搜索。

1、计 量 经 济 学 Econometrics 任课老师:李平 2006年1月,主要内容,多重共线性 残差正态性检验 异方差 自相关 工具变量,复习,经典回归模型的基本假设:,假定1:,假定2:数据矩阵X列满秩,即矩阵 的逆存在。,假定3:,假定4:,复习,在这些基本假设下,最小二乘估计量是:,复习,为了构造置信区间和进行假设检验,还需要,假定5:,复习,t 检验(偏回归系数检验):,F 检验(线性约束检验):,假定2:数据矩阵X列满秩,即矩阵 的逆存在。,多重共线性,多重共线性,多重共线性(multicollinearity)的定义:,一个回归模型中的一些或全部解释变量之间存在一种完全或不完全

2、的线性关系。,完全多重共线性,不完全多重共线性,多重共线性,为什么要假设无多重共线性?,如果是完全多重共线性,若矩阵 的逆不存在,则下面的方程没有唯一解,完全多重共线性只是一种极端的隐患,更常见的是出现不完全的多重共线性。,多重共线性,如果是不完全多重共线性,矩阵 的逆存在,则下面的方程有唯一解,且解为:,只要不是完全多重共线性,用OLS仍可得到系数的估计量及其标准差,并且仍是BLUE;尽管是BLUE,但估计量的标准差非常大,即估计的精度很小,这是高度(不完全)多重共线性所带来的理论上的唯一影响。,回忆:,不完全多重共线性,回忆:,特例:,通过矩阵的一系列初等变换,变量X3这一列几乎为零。,即

3、使总体中各X变量没有线性关系,但获得的样本数据中X变量之间却可能存在高度的共线性,因此,多重共线性本质上是一种样本现象。,多重共线性,不完全多重共线性对预测的影响 如果回归分析的唯一目的是预测,而不必关注参数估计的可靠性,并且如果不完全共线性的结构在样本和未来都保持一致,那么不完全多重共线性不是一个严重的问题,因为预测只关心模型是否捕捉到了X对Y的解释能力,并且拟合优度越高(当然过度拟合除外),预测越准。 如果不完全共线性的结构在未来发生变化,则预测是冒险的。,多重共线性,不完全多重共线性的特征: 偏回归系数的 t 值会降低,倾向于统计上不显著; 虽然系数不显著,但总的拟合优度R2却可能非常高

4、; 可能出现每个偏回归系数的 t 值都不显著,但回归方程的F值却很显著。 系数可能有符号错误或有难以置信的数值。 OLS估计量及其标准误差对数据的微小变化很敏感。,一个不完全多重共线性的例子:,不显著,高度显著,很大,多重共线性,不完全多重共线性的来源 数据采集方法,如抽样仅限于各回归元取值的一个有限范围内; 数据总体所固有的约束,如收入高的家庭比收入低的家庭有更大的住房; 时间序列数据中回归元具有相同的时间趋势。,多重共线性,多重共线性的侦察 多重共线性是一个程度问题而不是有无的问题; 侦破多重共线性的方法一般基于一些经验指标(即从多重共线性的实际后果来反推多重共线性的存在,但一个共同问题是

5、这些实际后果只是多重共线性的必要条件而不是充分条件)。,1. 根据回归输出结果来侦察,2. 根据相关系数输出结果来侦察,3. 根据矩阵 的条件数来侦察,矩阵的特征根越大,所对应的特征向量的信息含量越多,多重共线性,补救措施 无为而治:多重共线性实质上是一个数据不足的问题,统计方法无能为力,因此当我们不能更准确地估计每个回归系数时,最好的做法就是有效地估计他们的一个线性组合。 经验规则: 根据先验信息对回归系数进行约束(增加一个条件); 综合利用横截面数据和时间序列数据; 剔除一个高度共线性的变量(最常用的方法); 数据转换(一阶差分); ,多重共线性,补救措施 主成分分析法(principal

6、 components) 因子分析法(factor analysis),主成分法,由于存在多重共线性,尽管数据矩阵X有k列,但可能只有少于k个真正独立的信息来源。,主成分法的思想:试图从矩阵X中找出一小组变量,从某种意义上讲,可以解释X中大多数的变化。,关键是这一小组变量如何找?,X各列的什么样的线性组合是X所有列的最佳拟合?,z1=Xc1,怎样确定?,可以证明(见格林经济计量分析p294),C1是 的特征向量,且是与最大的特征根对应的特征向量。,矩阵 中的信息可由z1=Xc1这个变量来解释的比例是:,重复以上过程找到第二主成分、第三主成分,当前n个主成分加总的信息达到一定程度(占如总信息量的

7、90%)时停止。,注意:主成分估计量是所有初始系数的组合,因此我们不可能对这些组合进行有意义的解释。,残差项正态性检验,假定5:,为什么需要正态性假设?,一个随机变量服从正态分布表示什么意思?,大样本情况下,残差项还需要正态性假设吗?,怎样检验残差项是否服从正态分布?,残差项正态性检验,雅克贝拉(JarqueBera)检验:,以OLS残差为依据,先计算残差的偏度S(skewness)和峰度K(kurtosis),再使用以下检验统计量:,Eviews演示(1),Eviews演示(2),P值越大,残差项越接近正态分布,残差项正态性检验,残差项违背了正态性假设,应该怎样处理?,1. 通过对残差的适当

8、处理,可以使处理后的残差 项服从正态分布。,2. 扰动项本来就不服从正态分布。如t分布等。,极大似然估计法,假定4:,怎样估计?,回忆:,不妨假设:,已知、对称正定矩阵,由于是正定对称矩阵,它可以分解为:,其中,C的各列是的特征向量,而且是的特征根矩阵。,令,则有,用P前乘,可得:,或,显然有:,所以,是的有效估计量,也叫的广义最小二乘(GLS)估计量。,可以证明:GLS估计量是广义回归模型中的BLUE估计量。,GLS估计需要知道,含有未知参数怎么估计?,具有代表性的问题是只涉及到一小组参数,满足 ( )。例如,称为可行广义最小二乘(FGLS)估计量。,两种最常见的非球形扰动项:,异方差的定义

9、:,对于模型 Y=X +,存在,异方差,W,异方差一般可归结为三种类型: (1)单调递增型: i2随X的增大而增大 (2)单调递减型: i2随X的增大而减小 (3)复 杂 型: i2与X的变化呈复杂形式,异方差,异方差,异方差,异方差的来源 学习过程 横截面数据(同一时点的不同实体变异程度不同) 异常值的影响 回归元的分布偏斜 回归模型的设定不正确(一些重要变量被忽视) 数据采集技术的改进,注意:异方差问题在横截面数据中 比在时间序列数据中更为常见。,异方差,出现异方差时的OLS估计,异方差,在异方差情形下,有限样本的OLS估计量仍是无偏的,并且在大样本情况下是一个一致估计量。 但是,OLS估

10、计量不再是有效(即最小方差)估计量。,异方差,出现异方差时使用OLS的后果 尽管偏回归系数都是无偏估计量,但不是有效的,因此如果继续使用OLS估计量,得到的置信区间将无谓的过大而造成本来显著的系数也会变成不显著。 总之,如果忽视异方差而一味使用一般的检验程序,则无论得出什么结论或作出什么统计推断,都可能产生严重的误导。,检验思路:,由于异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:,异方差,检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。,因随机误差项方差的样本对应物是OLS的残差平方和,因此所有的检验方法都基于残差。,异方差,

11、利用残差图做初步判断 :,异方差,常见的检验法 帕克检验(Parke) 戈德菲尔德匡特检验(GoldfeldQuandt) 怀特检验(White) 格莱舍检验(Glejser) 自回归条件异方差(ARCH)检验,基本思想: 尝试建立方程:,或,异方差,帕克检验:假设 是解释变量X的某个函数,异方差,戈德菲尔德匡特(GoldfeldQuandt)检验:,1. 将X值从小到大顺序将观测值排序。,2. 略去居中的c个观测值,并将其余观测值平均分成两组(其目的是为了突出两组之间方差的差异),3. 分别对较小值组和较大值组作OLS回归(假设同方差), 得到残差平方和 。,异方差,4. 如果 服从正态分布

12、并且同方差假设正确,则比率 直观上讲,若上述异方差结构存在,则F值一定很大,因此若计算的F大于某一临界值,则拒绝同方差假设。,局限性:该检验成功与否要依赖于c值的选取,一般认为c的取值不应大于n/3;另一不足是残差结构不具一般性。,异方差,怀特(White)异方差检验,异方差,怀特(White)检验,一般性:不要求排序也不依赖于正态假设,且易于实施,基本思想:,(1),步骤1:假设同方差,对(1)进行OLS估计获得残差,异方差,步骤2:作辅助回归并得到拟合优度R2,异方差,步骤3:在无异方差的原假设下有,步骤4:若计算的 nR2超过选定显著性水平的临界值, 则拒绝同方差假设。,nR2怀特统计量

13、,其直观含义是若存在异方差,则辅助回归模型总体上一定显著。,例子:现有81辆汽车在每加仑里程数(MPG)、发动机马力(HP)数据、驾驶空间的立方英尺数(VOL)、最高时速(SP)和以100磅为单位的车身总量(WT)方面的数据。,OLS输出结果,Eviews演示(1):怀特检验,Eviews演示(2):怀特检验,无交叉项,显著存在异方差,Eviews演示(3):怀特检验,有交叉项,显著存在异方差,异方差,Glejser检验,自回归条件异方差(ARCH)检验,异方差,补救措施 异方差性不损失OLS估计量的无偏性和一致性,但却损失有效性,进而使得通常的假设检验变得可疑,因此补救措施是必需的。,怎样补

14、救?,异方差的定义:,对于模型 Y=X +,存在,异方差,W,W是一对称正定矩阵,存在一可逆矩阵D使得 W=DD/,用D-1左乘 Y=X+ 两边,得到一个新的模型:,该模型具有同方差性。因为,GLS法:,或,这就是原模型 Y=X+ 的加权最小二乘(WLS)估计量,是无偏、有效的估计量。,这里权矩阵为D-1,它来自于原模型扰动项的方差-协方差矩阵2W 。,以1/i2为权重加权,即来自有较大变异的总体的观测值将得到较小的加权,而来自有较小变异的总体的观测值将得到较大加权。,以异方差形式Var(ut) = 2 xt2为例, 2 W =,D-1 =,权重:,假设Glejser检验结果是,说明异方差形式

15、是Var(ut) =,用 除原模型各项,则消除了异方差。,直接利用WLS需要知道W。,如果不知道W,则利用FGLS。,如何得到2W ?从前面的推导过程看,它来自于原模型扰动项的方差-协方差矩阵。,因OLS残差平方和是扰动项的一致估计量,因此,仍对原模型进行OLS估计,得到随机误差项的近似估计量i,以此构成权矩阵的估计量,即,Eviews 演示:WLS,例子:现有81辆汽车在每加仑里程数(MPG)、发动机马力(HP)数据、驾驶空间的立方英尺数(VOL)、最高时速(SP)和以100磅为单位的车身总量(WT)方面的数据。,WLS输出结果,OLS输出结果,异方差,怀特调整法,怀特(1980)证明,异方

16、差,怀特调整的不足:,是一个大样本程序;,如果事先知道异方差的模式,则怀特调整不如WLS。,建议:样本较小时用WLS, 大样本时用怀特调整法。,Eviews 演示:怀特调整法,例子:现有81辆汽车在每加仑里程数(MPG)、发动机马力(HP)数据、驾驶空间的立方英尺数(VOL)、最高时速(SP)和以100磅为单位的车身总量(WT)方面的数据。,怀特法,WLS,OLS,样本教小时,WLS的效果较好。,例. 中国农村居民人均消费支出主要由人均纯收入来决定。 农村人均纯收入包括:(1)从事农业经营的收入,(2)包括从事其他产业的经营性收入,(3)工资性收入、(4)财产收入,(5)转移支付收入。 考察从

17、事农业经营的收入(X1)和其他收入(X2)对中国农村居民消费支出(Y)增长的影响:,案例分析:,普通最小二乘法的估计结果:,异方差检验,(1) G-Q检验,将原始数据按X2排成升序,去掉中间的7个数据,得两个容量为12的子样本。 对两个子样本分别作OLS回归,求各自的残差平方和RSS1和RSS2:,计算F统计量: F= RSS2/RSS1=0.2792/0.0648=4.31,查表 给定=5%,查得临界值 F0.05(9, 9)=2.97 判断 F F0.05(9, 9) 否定两组子样方差相同的假设,从而该总体随机项存在递增异方差性。,(2)怀特检验,作辅助回归:,似乎没有哪个参数的t检验是显

18、著的 。但 n R2 =310.4638=14.38 =5%下,临界值 20.05(5)=11.07,拒绝同方差性。,去掉交叉项后的辅助回归结果,(1.36) (-0.64) (064) (-2.76) (2.90) R2 =0.4374,(3)原模型的加权最小二乘回归,对原模型进行OLS估计,得到随机误差项的近似估计量i,以此构成权矩阵2W的估计量;再以1/| i|为权重进行WLS估计,得,各项统计检验指标全面改善,在实际操作中人们通常采用如下的经验方法: 采用截面数据作样本时,不对原模型进行异方差性检验,而是直接选择加权最小二乘法或者怀特调整法。,如果确实存在异方差,则被有效地消除了;,如

19、果不存在异方差性,则加权最小二乘法或怀特调整法等价于普通最小二乘法。,自相关,横截面数据时常受异方差问题的纠缠,但一般不会考虑各单元的误差项之间会存在相关性。 但在处理时间序列数据时,对同一总体的连续的观测很可能表现出某种系统的相关性,特别是连续观测的时间间隔很短时,如一周、一天、甚至一天内多次观测。,自相关,自相关的性质 CLRM假设干扰项之间不存在自相关 但实际上我们面临更多的情况是存在自相关,自相关,自相关的形式,通常假定误差项的自相关是线性的。计量经济模型中自相关的最常见形式是一阶自回归形式:,ut = ut-1 + vt.,vt 满足通常假设:,E(vt ) = 0, t = 1,

20、2 , T, Var(vt) = v2, t = 1, 2 , T, Cov(vi, vj ) = 0, i j, i, j = 1, 2 , T, Cov(ut-1, vt) = 0, t = 1, 2 , T, 的取值范围是 -1,1。当 0 时,称ut 存在正自相关;当 0时,称ut存在负自相关。当 = 0时,称ut不存在自相关。,一阶自回归形式时,ut 的期望、方差与协方差公式:,E(ut) = E( ut -1 + vt) = E(ut -1) + E(vt),因为对于平稳序列有E(ut) = E(ut -1),整理上式得,整理上式得,Var(ut) = u2 = v2 / (1-

21、2 ) Cov(ut, ut-1) = E(ut ut-1) = E( ut -1 + vt) ut-1) = Var(ut-1) = Var(ut) = u2,同理 Cov(ut, ut-s) = s Var(ut) = s u2, (s 0 ),令 u = (u1 u2 u3 uT)/,E(u u ) = = u2,其中,u2 = v2 / (1 - 2 )。,自相关,自相关的来源 时间序列的惯性 设定误差:残差中含有本应纳入而未纳入模型的变量,而这些变量之间存在相关性 不正确的函数形式 蛛网现象 滞后效应(自回归) 数据转换(一阶差分) 非平稳性,自相关,在自相关情形下,有限样本的OLS

22、估计量仍是无偏的,并且在大样本情况下是一个一致估计量。 但是,OLS估计量不再是有效(即最小方差)估计量。,自相关,出现自相关时使用OLS的后果 尽管偏回归系数都是无偏估计量,但不是有效的,因此如果继续使用OLS估计量,得到的置信区间将无谓的过小而造成本来不显著的系数也会变成显著。 总之,如果忽视自相关而一味使用一般的检验程序,则无论得出什么结论或作出什么统计推断,都可能产生严重的误导。,检验思路:,自相关,检验自相关,也就是检验随机误差项之间的相关性及其相关的“形式”。,因随机误差项的样本对应物是OLS的残差,因此所有的检验方法仍基于残差。,自相关,自相关的侦察 图解法 回归检验法 德宾沃森

23、(DW)检验 戈弗雷布罗施(GB)检验,自相关,图解法(非正式方法) 将残差对时间描点,以发现残差在时间上的特定关联,(1)回归检验法,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。,回归检验法的优点是: (1)能够确定序列相关的形式, (2)适用于任何类型序列相关性问题的检验。,(2) DW(Durbin-Watson)检验法,DW检验是J. Durbin, G. S. Watson于1950,1951年提出的。它是利用残差et 构成的统计量推断误差项ut 是否存在自相关。,使用DW检验,应首先满足如下三个条件 :,(1)误差项ut的自相关为一阶自回归形式。 (2)因

24、变量的滞后值yt-1不能在回归模型中作解释变量。 (3)样本容量应充分大(T 15),DW =,其中分子是残差的一阶差分平方和,分母是残差平方和。把上式展开,,DW =,因为有,所以,因为 的取值范围是 -1, 1,所以DW统计量的取值范围是 0, 4。, 与DW值的对应关系及意义,推导统计量DW的精确抽样分布是困难的,因为DW是依据残差et 计算的,而et的值又与xt的形式有关。DW检验与其它统计检验不同,它没有唯一的临界值用来制定判别规则。,然而Durbin-Watson根据样本容量和被估参数个数,在给定的显著性水平下,给出了检验用的上、下两个临界值dU和dL。判别规则如下:,注意:因为D

25、W统计量是以解释变量非随机为条件得出的,所以当有滞后的内生变量作解释变量时,DW检验无效。不适用于联立方程模型中各方程的序列自相关检验。DW统计量不适用于对高阶自相关的检验。,(3)拉格朗日乘数(Lagrange multiplier)检验,拉格朗日乘数检验克服了DW检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形。 它是由戈弗雷(Godfrey)与布劳殊(Breusch)于1978年提出的,也被称为GB检验。,对于模型,怀疑随机扰动项存在p阶序列相关:,GB检验可用来检验如下受约束回归方程,约束条件为: H0: 1=2=p =0,约束条件H0为真时,大样本下,其中,n为样本容

26、量,R2为如下辅助回归的可决系数:,给定,查临界值2(p),与LM值比较,做出判断, 实际检验中,可从1阶、2阶、逐次向更高阶检验。,例子:,下表给出了美国商业部门19591998年间人均真实工资(Y)与人均产出指数(X)的数据。,Eviews演示(1):DW值,存在显著正相关,Eviews演示(2):GB检验,输出,存在显著自相关,自相关,自相关的补救措施 查明是模型误设还是纯粹自相关。 若是纯粹自相关,可对原模型进行适当变换,使用GLS、广义差分法或FGLS 大样本下,可用尼威韦斯特(Newey-West)方法,得到OLS估计量在对自相关加以修正后的标准误差,该方法实际上是对怀特异方差一致

27、标准误方法的推广。,1、广义最小二乘法,对于模型 Y=X+ 如果存在序列相关,同时存在异方差,即有,是一对称正定矩阵,存在一可逆矩阵D,使得 =DD/,变换原模型: D-1Y=D-1X +D-1 即 Y*=X* + * (*),(*)式的OLS估计:,这就是原模型的广义最小二乘估计量。,该模型具有同方差性和随机误差项互相独立性:,如何得到矩阵?,如设定随机扰动项为一阶序列相关形式 i=i-1+i 则,如果原模型,存在,可以将原模型变换为:,该模型为广义差分模型,不存在序列相关问题。可进行OLS估计。,广义差分法就是GLS,但是却损失了部分样本观测值。,这相当于,去掉第一行后左乘原模型Y=X+

28、。即运用了GLS法,但第一次观测值被排除了。,如:一阶序列相关的情况下,广义差分是估计:,3、随机误差项相关系数的估计,应用广义最小二乘法或广义差分法,必须已知随机误差项的相关系数1, 2, , L 。 实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。,科克伦-奥科特迭代法,以一元线性模型为例: 首先,采用OLS法估计原模型 Yi=0+1Xi+i 得到的的“近似估计值”,并以之作为观测值使用OLS法估计下式 i=1i-1+2i-2+Li-L+i,类似地,可进行第三次、第四次迭代。,关于迭代的次数,可根据具体的问题来定。 一般是事先给出一个精度,当相邻两次1,2, ,L的估计值之

29、差小于这一精度时,迭代终止。 实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为科克伦-奥科特两步法。,在Eview软件包中,通过在解释变量中引入AR(1)、AR(2)、,即可得到参数和1、2、的估计值。其中AR(m)表示随机误差项的m阶自回归。在估计过程中自动完成了1、2、的迭代。,Eviews演示(1):广义差分法,Eviews演示(2):广义差分法,OLS,不存在自相关,自相关,大样本下,可用尼威韦斯特(Newey-West HAC)方法,得到OLS估计量在对自相关加以修正后的标准误差,该方法实际上是对怀特异方差一致标准误方法的推广。,适用于同时存在自相关和异方差的情况

30、 只对大样本适用 只修正标准误而不会改变系数的估计值,Eviews演示(1):NW法,Eviews演示(2):NW法,仍存在自相关,广义差分法,样本较小时,广义差分法较好。,经济理论指出,商品进口主要由进口国的经济发展水平,以及商品进口价格指数与国内价格指数对比因素决定的。 由于无法取得中国商品进口价格指数,主要研究中国商品进口与国内生产总值的关系。,案例分析:中国商品进口模型,1. 通过OLS法建立如下中国商品进口方程:,(2.32) (20.12),2. 进行序列相关性检验,3阶滞后:,采用科克伦-奥科特迭代法估计,取=5% ,DWdu=1.66 (样本容量:22) 表明:广义差分模型已不

31、存在序列相关性。,(3.81) (18.45) (6.11) (-3.61),可以验证: 仅采用1阶广义差分,变换后的模型仍存在1阶自相关性; 采用3阶广义差分,变换后的模型不再有自相关性,但AR3的系数的t值不显著。,3、运用广义差分法进行自相关的处理,与处理异方差相似,在实际操作中人们通常采用如下的经验方法: 采用时间序列数据作样本时,不对原模型进行自相关检验,而是直接选择广义差分法或者NW法。,如果确实存在自相关,则被有效地消除了;,如果不存在异自相关,则广义差分法或NW法等价于普通最小二乘法。,假定3:,违背这个假定将导致最小二乘估计的有偏。,回忆:,如果违反这个假定,怎么处理呢?,工具变量法,在经典回归模型中,最小二乘具有一致性:,但这依赖于,而满足这个条件需要,假定3:,假设存在有K个变量的矩阵Z,满足,和,那么这个Z叫做工具变量。工具变量的估计量为,可以证明,因此,只要能找到恰当的工具变量,仍然可以最小二乘法进行估计。,但是,工具变量的寻找很少有规律可循,主要靠经验。,小结,经典回归模型的基本假设:,假定1:,假定2:数据矩阵X列满秩,即矩阵 的逆存在。,假定3:,假定4:,假定5:,数据的问题,没有特别好的处理方法。,截面数据:异方差; 时间序列数据:自相关 处理方法:GLS,极大似然估计法,工具变量法,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1