使用GMM方法分析动态面板数据.doc

上传人:scccc 文档编号:12944208 上传时间:2021-12-08 格式:DOC 页数:9 大小:99KB
返回 下载 相关 举报
使用GMM方法分析动态面板数据.doc_第1页
第1页 / 共9页
使用GMM方法分析动态面板数据.doc_第2页
第2页 / 共9页
使用GMM方法分析动态面板数据.doc_第3页
第3页 / 共9页
使用GMM方法分析动态面板数据.doc_第4页
第4页 / 共9页
使用GMM方法分析动态面板数据.doc_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《使用GMM方法分析动态面板数据.doc》由会员分享,可在线阅读,更多相关《使用GMM方法分析动态面板数据.doc(9页珍藏版)》请在三一文库上搜索。

1、对外经济贸易大学金融学院张海洋GMM方法与动态面板数个简介2015年8月在阅读文献中经常看到有使用GMM方法分析动态面板数据,但没有深入研究。垠近开 始自己用此方法时,感觉很困感,因为使用此方法的文献中,対方法的原理人多语焉不详。 対该方法的适用性,为什么用此方法,以及方法优缺点介绍聊聊几句。因此,通过读文献很 难对该方法有全面的把握。由于时常有学生过来问我怎么用GMM方法处理动态面板数据,不能总是含糊地回答, 同时自己也在写这方面的文章,因此找来儿本参考书,搜集了人量的文献,详细阅读之后, 撰写本文。文中主要内容摘要并整理fl Roodman (2009),这是STATA命令xtabondZ

2、命令的 作者所写的介绍性文章,应该有权威性,如果该文不准确,那么所有使用此命令做的研究将 全部失效。同时参考了Cameron and Trivedi (2009)和(Angrist and Pischke, 2009)等书籍。 本文仅为作者对该方法的理解,如有不妥、疑问或建议请联系:hyang_zhang 163 com。(一)为什么要用GMM方法本文所谓动态面板数据(Dynamic Panel data, DPD)分析,指的是分析中采用如下的回归 方程:i =, t =1,.,T其中,是因变量的滞后项,叫是个体i的同定效应。因变量的滞后项和固定效应 同时存在,是动态面板数据分析特殊性的关键。

3、如果固定效应不存在,那么回归方程变为:乂广叫+ “兀+為这时,用OLS或者随机效应模型回归分析即町。如果因变量的滞后项电卜1不存在,那 么回归方程变为:(3)对于该模型,用固定效应模型分析即可。如果因变量的滞后项和固定效应都存在.那 么对于(1)式这样的回归方程,如果采用差分方法去掉固定效应,会得到如下的结果W啦T + 05 +临其中£=££“,勺厂切弘。如果(1)式代表了真实的变量之间关系,那么Xz和之间必有相关性,因为:cov(AYu,At)显然不会等于6冈为两昔都有气“这一项。通常所用的固定效应模型实际上就是对(1)式差分,得到类似于(4)式的差分回归 方程

4、,然后做OLS。对于现在的情况,由于Xz和之间的相关性,再用OLS只会得到 冇偏误的回归系数。所以传统的统计方法无法实现对此类方程的估计,需要用GMM方法。需要注意的是(2)的模型(包含滞后项的OLS)和(3)的模型(不包含滞后项的FE.定效应)尽管都有偏误,但好处是一个債大,一个偏小(具体哪个大,哪个小要变之间 的关系),所以这两个估计系数应该界定了真实參数的范围(Angnst and Pischke, 2009:246 页:Roodman, 2009) «也就是说,你最后用GMM方法估计出来的参数应该落到这个区间。(二)什么是GMM方法通常所用的OLS等方法,基本逻辑是从计量模型

5、对数据拟合的角度分析,得出最好的 估计参数。GMM方法,又称为广义矩方法(Genei*alized Moment Method )该方法所用的思 路与传统思路完全不同。任何计臺模型都有一定的适用性,即数据要满足一定的要求。GMM 方法的思路是,从计量模型对数据的要求出发,得出一系列矩条件,再根据这些矩条件,求 解満足条件的系数。对于人多数计量模型,GMM方法和传统的方法“殊途同归”,得出的回 归系数相差不会太远。1、线性回归中的GMM方法以OLS为例,对于回归方程:对外经济贸易大学金融学院张海洋Y = X 卩 + £传统OLS模型中,卩的估计®p01J=(X-X)-1(X,

6、Y)o注意到,如果使用OLS模型,数 据有要求,就是自变帚X和误差项£要独立,也就是说:E(X,s) = O这个就是所谓的"矩条件”。把e = Y-卩X带入,得到E(X,(Y-X卩)= 0,即:E(X'Y) = E(X,X)pp = E(X,X)_1E(X,Y)为了得到卩的估计量,可以把E(X»X)和E(X,Y)的估计量分别带入,即E(X*X)=丄XX, E(XrY)=丄2丫NN得到卩GMM = (X,X)Tx,Y,这是和传统的OLS样的估计杲。2、工具变量的GMM方法工貝变最方法也可以用矩估计的思路实现。由于过程略复杂,此处仅给出简要步骤,详细的推导可以

7、参考(Roodman, 2009)。需要回归的方程为:其中,Z是工具变量,E(s|Z)= (o X = (X1,x2.xk),是k个自变量向量,Z = (zpz2.z.)是了个工貝变量向量。相应的,待估计的系数卩是k维向量。定义E = Y-X卩为误差向最,对于任意估计出来的参数R ,残差项为E = Y-Xpft根据工具变量的含义,它应该和误差项£独立:E(Z*£)=0,这就是我们需要的矩条1A件。计算的时候,理论上应该利用 码乜)三ZE = 0求解,江意到,我们仃j个工具 变量,也就是j个矩条件(j个方程)。理论上,需要根据这j个方程求解k个待估计的参 数。但是不幸的是,如

8、果工貝变最的数杲j小于待估计的参数数鼠k,方程是不可识别的一 一通常不可能通过2个方程解岀3个未知数。如果工貝变量等于待估计的参数,是恰好可识别 的,但这种情况在GMLI中很难碰到。最常见的是工只变量多于待估计的参数,即j>k, 这意味着要找k个参数,让j个方程同时等于零。这难度相当人,实际上人多数时候找不到,1A怎么办呢?在矩估计里面,采用的办法是,找k个参数,让EN(Zr£)HZ*E和零之间的 距离般小。实际计算的时候,需要借助一个半正定的矩阵A ,计算向量坯(乙隹)的模:际无讥三 存吭=N(lz»E)fA(A-Z*E) = A_E*ZAZ»E目标变成,

9、寻找参数向®:pA=argniiii|EN(ZfE)|A,这就要用到一阶条件等于零:d|EN (Z)!2 *H._E*ZAZ7-X) = 0d0N计算的过程利用到J'连锁规则利向量求导的公式。继续推导,把E = Y-Xp带入,得 到:0 = 0ZAZ/X = (Y-Xp),ZAZ,X = Y,ZAZ,X -X1ZAZXPA=(X1 ZAZX)1 X,ZAZ,Y这就是0的GMM估计量,这个估计量是有偏的,它的期望值不等于真实的卩:然而它 是一致的,当样本量足够人的时候,它会接近真实的卩。这个估计量和A何关,但是A只影 响参数估计的有效性一一不同的A对应的参数Ba收敛的速度不同。

10、这里的Alt实是对不同的 矩条件加以不同的权重,可以找到一个收敛最快的A,称为Aegmm,可以证明:Aegmm 二 Var(z£尸。对于工具变量法常用的两阶段最小二乘法(2SLS),如果假定谋差项是独立同分布,那 么= VaiXzE)-1)-1,此时Bgmm =(X,Z(Z 忆)t ZX)1 XZ(ZZ 尸 Z*Y这实际上就是传统通过两阶段敲小二乘法(2SLS)估计出来的参数,殊途同归。3、GMM方法的有效性(Haiisen检验和Sargan检验)I A前文己经介绍,使用GMM方法的目标足选择参数,最小化En(ZP)三NE和零之 间的即离|Eh(Z*£)|ao那么问题来了.

11、名小算小呢?会不会是最小值也八幺人于零?如果 这样的话,方法的适用性就成问题。也就是说,根据你估计出来的参数,算出的残差项实际 上和工具变量不是独立。Hansen检验和Sargan检验的逻辑就是,以|%(乙9儿最小化为目 标,估计出参数,然后把参数带入,看看它是否真的等于零。如果统计上不能拒绝它等于零, 则所用工具变量可靠;如果统计上拒绝它等于零,则不可靠。1八如果零假设成立(即工只变量是联合有效的人那么En(Z®三一Z,E应随机分N布于零附近,它和零的距离应服从Z?分布:IIen(z,£)L三加耳匸=存亠站咆入这就是Hansen统计量,它服从口由度为j-k的;分布,这里口

12、由度其实就是过度识 别的维度。在实际使用中,不应该显著(P值小于0.1);如果显著,则表明拒绝了零假设, 工具变量不是联合有效的。然而,需要注总的是,如果使用的工具变量太藝,那么Hansen 统计量会非常不显著,常常等于1。这是因为,j-k越人,总味着z?分布显著的门槛越高 (请査阅2?分布的表格)。也就是说,工具变最太多.会讣Hansen检验的效果变弱,这是需 要注意的。通常Hansen检验的p值大于0. 25就要小心了,这时需要考虑减少工具变量的数量。Sargan检验的统计量类似,只不过把Hansen统计量中的AEGmi替换成了(Z,Z)“,即S = |%(Z叽=存Z(Z忆尸Z氓 zVk然

13、而,该统计量有时候是不一致的,如果在命令中要求报告稳健的Sai-gan统计量,软件 会做两阶段GMM估计(先找任意合理的H,令A=(ZHZ)_1,估计出第一步参数B:再根 据计算出残差项的方差协方差矩阵令A=(Z»Q. Z)-1,估计出第二部参数g),1PlP1忆根据第二步的参数结果,默默报告出Hansen统计彊。整体上说,Hansen统计慣好像更黒谱一 点,所以报告的时候,更多关注Hansen统计童。(三)动态面板数据现在回到我们的动态面板数据,对数据和模型有如下假定:1) 动态。模型中包含了因变量的滞后项:2) 有个体的固定效应;3) 可以有一些自变量是内生的:4) 除了固定效应

14、之外的误差项©可以异方差,可以序列相关;5) 不同个体之间的误差项©和J不会相关.6) 可以有前定的(Predetermined)但不是完全外生的变量。7) “大N,小T”,即个体数量要足够多,但时间不用太长。如果时间足够长的话,动 态而板误差不会太人,用固定效应即可。从上述要求可以看出,GMM方法特别适合宏观的面板数据分析,因为宏观变呈中,很 难找出绝对外生的变屋,变量之间多少会互相影响。而GMM方法可以“令一些自变量是内 生的”,这可能也是GMNI方法在文献中这么常用的原因。此前已经说过,不能用传统的OLS方法或者固定效应模型进行动态面板数据的分析, 那样会得到有偏的估

15、计量。先要对数据进行一定的变换,然后根据不同的矩条件设定开展矩 估计。其中数据变换有两种方法,矩条件的设定也有两种方法。1、数据的变换方法:一阶差分还是垂直离差为了消除动态面板数据中的固定效应,通常用的有两种方法:一阶差分(first difference)和垂直离差(orthogonal deviations) o 一阶差分之前己经介绍过了,这种方法 是difference GMM中默认的方法。缺点是如果数据中右缺失值,那么最终的估计会缺失很 多样本,原始数据缺一行往往会导致差分后的数据缺两行。一种替代的方案是用垂直离差 (xtabond:命令中用orthogonal选项实现),每个变最减去

16、该变最未来所有观测值的平均 值,即:叫曲丄三4(%-齐工叫)5>t式子中,陷=虫/厲+ 1)为调整权重变量,I;是从t期开始以后观测值的数量。对 F非平衡面板,和数据有缺失的面板,这种方法避免了因缺失数据带來的样本损失,因为调 整的时候只是把未來的平均值减去,样本数不会因缺失未来个别观测值而受损。然而,对于 平衡面板数据,一阶差分和垂直离差估计出来的结果会完全一样。2、DifTerent GMM 还是 System GMM令数据变换之后的回归方程变为这种变换可以是一阶差分,也可以是垂直离差。DifferentGMM的逻辑是,如果是垂直 离差变换,用=1作为Xt-i *的工貝变量;如果是一

17、阶差分变换,用作为Xt-i*的工 具变量,此时丫卜=4丫片。对应的工具变量也类似,如果是垂直离差,就用滞后一 阶的,如果是差分就用滞后一阶的差分作为工具变量。在实现的时候,为了提高估计的有效 性,通常还会加入更高阶的滞后项(滞后差分)作为工貝变量。这些变量的加入利用了更多 的信息,然而也会带来麻烦,让工只变鼠的数最随T平方成比例増加.为了控制工貝变最的 数量,一个选择就是采用collapse选项把这些工具变量变成一列。如果因变彊的变化过程接近随机游走,那么Difference GMM的估计量会有较人偏差。System GMM的方法和Different GMM完全不同,它不蛊要对门变量和因变量进

18、行数据变换。它假定匸貝变最的差分,即AWtFt -,应该外生于固定效应:E(E;M)=O。如果w是内生的,wm就町以作为工只变量,更高阶的差分也町以做工只变量。如果w是 前定的但不是完全外生的,可以作为工貝变彊,更高阶的差分也可以做工貝变最。肖 然,更高阶差分加入后,还是会增加工具变量数量,需要在具体计算时想办法控制。(四)使用GMM方法的注意事项 町以尝试先做(2)式的OLS,再做(3)式的固定效应。当然这两个估计都是有偏误 的,然而这两个估计的系数应该是真实系数的上限和下限,町以给敲后的GMM估计限 定参考范用。 “An,小T”,如果N太小了,则估计出来的标准差可能不太靠谱实际上如果用 省

19、际面板去做的话,不满足“大N”这个条件,但中文文献中充斥着这样的研究。如果 样本的N较小,但还可以接受(比如N=70),然而又想用此方法,那么加上small选项。 解释变量中,放入时间虚拟变最。比如,数据有10年,则放入9个虚拟变量。加入后, 可以让"误差项©和J不会相关”这个条件更容易满足。 如果数据中间有间隙,尽量利用垂直离差(对于每个变呈,包括自变呈和肉变屋,减 去它未來值的平均值,就是加上orthogonal选项,见Roodman (2009),这会减 少样本最的损失。因为数据中间缺一行,一阶差分后就会缺两行数据。 但对平衡面板数据.两种数据变换方法结果一样. 通常

20、,每个自变量都要岀现两次(除了系统外的工具变量)。先作为自变量出现在在 xtabond2命令中逗号的左边,再以某种形式作为工具变最出现在逗号右边。如果变最 w是完全外生的,那么放到ivstyg(w)(表示直接作为工具变量);如果w是前上 的,但不是完全外生的,则放到gnunstyie (w)(表示从滞后一期开始都作为工具变量); 如果w是内生的,则放到gmmstyle(L.w)(表示从滞后两期开始都作为工具变量)°报告工具变量的数量如果按照匕一条的做法,工具变最的数呈会很多。这样会导致 ovei'identification test不准确,【一个标志就是Hansen统计量的

21、p值变为1, Hansen test 的P值在(0.1,0.25)之外都要小心,太小表明拒绝工具变量有效的假设,太大表明选 的工具变量太多,hansen检验变弱了】。通常,需要限制工貝变量数量,可以用collapse 选项,也可以用laglimits ()选项。习惯做法是,选择不同数最的工具变量以显示估 计系数的稳健性。工具变量数量的上限就是模型中个体的数量(也就是N),超出此上 限,xtabond2命令会报警。 使用system GMM的时候要注意,能使用该模型的前提是,工具变量的变化叫-卜】 要和固定效应垂直。因此数据应该在稳态附近,否则这些变最的变化就会和I古I定效应关 系比较人,从而不

22、满足system GMM适用的条件。 由于GMNI方法有很参设定选项,在报告结果时,报告你的选项。System GMM还是 Difference GMM:是用垂直离差还是一阶差分;选用什么工具变最,滞后几期;选 择什么样的robust标准差,等等。参考文献1 Angnst, J D. and J Pischke , Mostly Harmless Econometrics. Pnnceton, New Jersey Pnnceton University Press, 20092 Roodman, D , "How to Do Xtabond?: An Introduction to Difference and System GMM in StataJ The Stata Journal, 2009. 1( 9)» 86136.9

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1