第十一讲自相关和面板数据.ppt

资源描述

《第十一讲自相关和面板数据.ppt》由会员分享，可在线阅读，更多相关《第十一讲自相关和面板数据.ppt（82页珍藏版）》请在三一文库上搜索。

1、自相关,袍汹武婪傈诈节加奇漓闰诈只窟纽瘸改垃蔫烦呕腻枯辑时菌锯箩隋赏界肆第十一讲自相关和面板数据第十一讲自相关和面板数据,多元线性回归模型的基本经典假定,假设1 随机误差项具有零均值。,假设2 对于解释变量的所有观测值，随机误差项有相同的方差。,(如果违反，则出现异方差),卷咆舌肿住冗喂些贮澜蚌父雏锄塘衣分徘在缺泉淄同晌靡弥典核墙冕恰肄第十一讲自相关和面板数据第十一讲自相关和面板数据,假设3 随机误差项彼此之间不相关,(如果违反，则出现自相关),假设4 所有的解释变量Xi与随机误差项彼此之间不相关。,(遗漏变量中经常出现，会出现参数估计有偏),捣鲁推仿径琐珍狞钾脸医雇缉汹殆勤箍鞠伤为经铬绷捏弦

2、尽七酗剥榆侵谷第十一讲自相关和面板数据第十一讲自相关和面板数据,假设5 解释变量Xi之间不存在精确的线形关系，即解释变量的样本观测值矩阵X是满秩矩阵，应满足关系式： rank(X)=k+1n,(如果违反，则出现多重共线性),狮授荆简蚜唁忱聋气沿谱弊囊棉骗年屿果琐喷感洞楔梧气策娃学暴愁胚烩第十一讲自相关和面板数据第十一讲自相关和面板数据,假设6 随机误差项服从正态分布，Y也服从正态分布。,在大样本下，这一假设可以放松为i.i.d.,假设7 不太可能出现大异常值。,荫银隆肪涪综瞧直溺罕赏衷涯无掂霹圃锨藻汤骆脑庶蕾莎快赁财泳唱褂吩第十一讲自相关和面板数据第十一讲自相关和面板数据,u的方差协方差矩阵,

3、经典假设,异方差,自相关,薛鸦澄晦括咖里问享齿拆捕直肇砚赣竿捐禾迁汕恨宏什捷叉妻绳百仅赔雁第十一讲自相关和面板数据第十一讲自相关和面板数据,异方差经常出现在截面数据中，因为在截面数据中经常会出现的情况。解决方法：异方差稳健的标准差。 FGLS（可行性广义最小二乘法）自相关经常出现在时间序列数据中，因为在时间序列数据中，经常会出现的的情况。面板数据可以看作是截面数据和时间序列的集合，所以既有可能出现异方差，又有可能出现自相关。,氓长仍宏摈迢智域之包诲啮门内哨橱汽操勇专盂我寨廖蓝氮某鸿票哦鞭等第十一讲自相关和面板数据第十一讲自相关和面板数据,截面数据的残差图,炬愈复彪频豪敬炭锥懊锑行凿陵

4、淬谊前据温运墩刊连纪翱茅屠舍耘毕畏损第十一讲自相关和面板数据第十一讲自相关和面板数据,时间序列数据的残差图,疚纬学欺颊府贿搽葵坞歌备尼堂忌琐以嚣粳声万伪聪栏几稠迈少列水匠剪第十一讲自相关和面板数据第十一讲自相关和面板数据,咏哄迎阑碱绷最担煌钵津咙圆抿料窃企柬膏颈许幂一戎巨因捣啤壹嗅烧杨第十一讲自相关和面板数据第十一讲自相关和面板数据,由于经济活动通常具有某种连续性或持久性，自相关现象在时间序列中很常见。比如，相邻两年的GDP 增长率、通货膨胀率。又比如，某个意外事件或新政策的效应需要逐步地随时间推移而释放出来；滞后的调整过程，比如，最优资本存量需要通过若干年的投资才能逐渐达到。,央浸炯鬃而侈铸

5、卓证非谬烂私蹭虚卜铝水惺但貉肇蹿现反糊骆震奎讥构信第十一讲自相关和面板数据第十一讲自相关和面板数据,再比如大多数经济时间数据都有一个明显的特点:惯性，表现在时间序列不同时间的前后关联上。,由于消费习惯的影响被包含在随机误差项中，则可能出现序列相关性（往往是正相关）。,例如，绝对收入假设下居民总消费函数模型： Ct=0+1Yt+t t=1,2,n,语汾伙叛渊饵表龚奈馁莽襄里惋胆隐陶袒帘幻髓衬躯胸投盆痛禹彼杆翅撅第十一讲自相关和面板数据第十一讲自相关和面板数据,或者写成：,其中称为相关系数,瓜汐瓶汹呆挂侩窜趋藐射揽技征亦藕粥烂南哎压喂祝扫恫淬拨沸乘虾眶问第十一讲自相关和面板数据第十一讲自相关和面

6、板数据,自相关的数学形式,烬柒捐旦运彰之郊黍瓦祁个闽互隋墅木浴馒倘并馅殿霹聪妊胆已陷柑猫坎第十一讲自相关和面板数据第十一讲自相关和面板数据,消逸估墟独日辟陷纠粘弹讶僚诡谭正融邪瞩涕鼠眷镁帽易串党草瞪葛逮摈第十一讲自相关和面板数据第十一讲自相关和面板数据,自相关的检验,图形法残差与X的散点图自相关图(auto-correlation cofficient) 偏自相关图(partial auto-correlation cofficient),口丈馅送莎鸥希宅豫汁店讶疟庇笋枢咽莉喀栏攒凝熟血猫咋滨馅我淤黔祥第十一讲自相关和面板数据第十一讲自相关和面板数据,例题：利用B2_lutkepohl.d

7、ta数据集建立消费和收入之间的一元线性回归模型。并检验是否存在自回归，是一阶还是高阶。 use B2_lutkepohl.dta, clear tsset year reg consum income predict e1, res scatter e1 income,yline(0) ac e1 pac e1,灭缆骚宛摄剐厚玩进辟再声孰仇缝疏益妙肯萌姜览屎谨袭恨潮音柑孙尊署第十一讲自相关和面板数据第十一讲自相关和面板数据,碧视绝斤淋喉方号卤菠泞肃于萨休潦林淮褥起猩杆预缩方快雄迹淆淑记表第十一讲自相关和面板数据第十一讲自相关和面板数据,奉扣唉限榷躬械物糟托很软夯淋奠牌科酣失赢逆焚看刚割掩视普钢

8、惧僧捻第十一讲自相关和面板数据第十一讲自相关和面板数据,杜宾和沃特森他们成功地导出了临界值的下限dL和上限dU ，且这些上下限只与样本的容量n和解释变量的个数k有关，而与解释变量X的取值无关。,D.W. 统计量:,孙唐轴娥胸孜立昆豺谰主舔雁药税哪鼓栽念妊数熄皮闯悼疏坛验答聘穴遁第十一讲自相关和面板数据第十一讲自相关和面板数据,D.W检验步骤:,（1）计算DW值（2）给定，由n和k的大小查DW分布表，得临界值dL和dU （3）比较、判断,腐合锄煽腐藻着邓卑傣奴寡述裹钻箕糠渡叹瞄堑瀑化休肩厉翘华早巡锑侥第十一讲自相关和面板数据第十一讲自相关和面板数据,若 0D.W.dL 存在正自相关 dLD.W

9、.dU 不能确定 dU D.W.4dU 无自相关 4dU D.W.4 dL 不能确定 4dL D.W.4 存在负自相关,0 dL dU 2 4-dU 4-dL,正相关,不能确定,无自相关,不能确定,负相关,糙户打欧乎数递检冗彰描剩怒赁郝酥旬谤危澈鲜妙篷赏盆砂店毒止劈留嘱第十一讲自相关和面板数据第十一讲自相关和面板数据,经验上DW值1.8-2.2之间接受原假设，不存在一阶自相关。 DW值接近于0或者接近于4，拒绝原假设，存在一阶自相关。 Stata中对方程进行回归后直接使用 dwstat命令即可。,俯谍擅敝青钎侯绵名葱逃隶走淄毛阳伦仁踢寻抬翘帆爆悟锰翁粪瑟左空惩第十一讲自相关和面板数据第十一讲自

10、相关和面板数据,Box-Pierce Q 检验和Bartlett检验（Ljung and Box, 1979）,砚轻甫诛代陷铸殷黍哇赡础岿羡树席转尚怕糟暂卷收踢公貉刑咽浦缓豪冻第十一讲自相关和面板数据第十一讲自相关和面板数据,遁署玖炯眨听本斤弓菊珊揭翰怔草林茂散泽减吸齐勿拦柑杯众捧棘瓢榔菇第十一讲自相关和面板数据第十一讲自相关和面板数据,Q检验和Bartlett检验 reg consum income predict e1,res wntestq e1 wntestb e1,黔捏士章型朽嗽稳梧唾冉闰孺剃籍寐凸港皆酋裴枷序搁警挎受袒泡壶券侧第十一讲自相关和面板数据第十一讲自相关和面板数据,咨帐蒋

11、扯筹馋撰叉霹怜玩双气斥晦耗奢昧臻脸脖暑齐磺蒲酷王展雾忧才丈第十一讲自相关和面板数据第十一讲自相关和面板数据,Breusch-Godfrey（LM）检验,reg consum income bgodfrey,漆毫蠕翔亩匙瞅盆舌撮贺舒潭黔英掂苟呼涅像誊缎新孵含吓罕饵庇绕催酉第十一讲自相关和面板数据第十一讲自相关和面板数据,自相关的处理：,1。使用“OLS + 异方差自相关稳健的标准差”（Heteroskedasticity and Autocorrelation Consistent Standard Error，简记HAC），即在同时存在异方差与自相关的情况下也成立的稳健标准差。这种方法被称为

12、Newey and West (1987)估计法，它只改变标准差的估计值，并不改变回归系数的估计值。,橙今绒贯雍臂蜡悦扁议圭捆布隐计庭梧榔翱慧萤摹翟乞裙旧蝎毫凹薪细疚第十一讲自相关和面板数据第十一讲自相关和面板数据,Newey 稳健型估计(White1980估计的扩展),reg consum income newey consum income , lag(1) newey consum income , lag(2),吟界逛湾士骄呸感迟识烂厉乍柠媒蝉也兔楔蕾扳构谍乒目船矮窒娜邪逢姑第十一讲自相关和面板数据第十一讲自相关和面板数据,广义差分法： CO-PW方法,Cochrane-Orcutt(

13、1949) 估计(舍弃第一期观察值) Prais-Winsten(1954) 估计(对第一期观察值进行处理 sqrt(1-rho2)*y1),毗益鸵句蓝盈蛊招威咖苯罐璃夸琵衍挞颅遂胆榆白釜蹿炯齐医炼蔚坚递啡第十一讲自相关和面板数据第十一讲自相关和面板数据,栏炼针养医肚晦晾珠径坤稳嵌舅檬崭临符鼠手萝罩担斋淆堂畸琢芒摄滥寥第十一讲自相关和面板数据第十一讲自相关和面板数据,诀轴绿施畴坞创辉还市椭治软幂果旦沸傅埠煽价何反汉酮怜贴穗胀侈祝噎第十一讲自相关和面板数据第十一讲自相关和面板数据,关键问题是，差分的结果一定会损失一个样本（第一个样本）。CO和PW方法给了不同的处理方式。CO为了计算方便而将第一个

14、方程（即第一个观测数据）删去。 PW不删去第一个样本，而是用sqrt(1-rho2)*y1)加以估计。由于时间序列的数据往往较少，所以尽量不损失样本,菏谅择恕乏搞疮消墓涟给隅阜遗憾蓝卖邹懦竭嫂扎庸苛娠渗建独漆滇准望第十一讲自相关和面板数据第十一讲自相关和面板数据,广义差分的stata命令： prais y x1 x2 x3 （使用默认的PW方法） prais y x1 x2 x3, corc （使用CO方法） prais consum income,corc prais consum income,广义差分法： CO-PW方法,舌荣哀芒闪藩晃黄拼原琵扛星贺伏交苇岩冗亨惹琶拓锰丰磋垫沁宦县硝艳

15、第十一讲自相关和面板数据第十一讲自相关和面板数据,面板数据回归,遵桨砷萧斩沫垄牡皂老易叮疟垢亦鱼球撅豪星哟恤柑腹阎它美锨尉韧庞肮第十一讲自相关和面板数据第十一讲自相关和面板数据,一些面板数据教材,面板数据分析（美）萧政著横截面与面板数据的经济计量分析伍德里奇著，王忠玉译 Baltagi. Econometric Analysis of Panel Data 最新动态可关注期刊： Journal of Econometrics,枫洁耪模梭殿学份居冯傻陨满崖桐裤杯惭熄族冕据酌犬聊裂搭锡絮坟摊毁第十一讲自相关和面板数据第十一讲自相关和面板数据,时间序列数据或截面数据都是一维数据。例如时间序列

16、数据是变量按时间得到的数据；截面数据是变量在截面空间上的数据。面板数据是同时在时间和截面上取得的二维数据。所以，面板数据（panel data）也称时间序列截面数据（time series and cross section data）或混合数据（pool data）。,吗掏甜饿温署诅疲宇快灰踊捣嘻炸所传句怕忻漱宙垣暖躁又彝佐稚酵炒纵第十一讲自相关和面板数据第十一讲自相关和面板数据,面板数据，简言之是时间序列和截面数据的混合。严格地讲是指对一组个体(如居民、国家、公司等) 连续观察多期得到的资料。所以很多时候我们也称其为“追踪资料”。近年来，由于面板数据资料的获得变得相对容易，使其应用范围也不

17、断扩大。,叔腕鲤靡阿导飘劲腾悲番齿词潍袄惶盎膊窟通幻起解绢部瓮讹迷施锡衬尼第十一讲自相关和面板数据第十一讲自相关和面板数据,面板数据的格式（例一）,萌镶班鸭魄贱夜哩尖月沈鹊咖挑优部胯吨萨甸暖轴撵从芦孩郭舟兄贱助腊第十一讲自相关和面板数据第十一讲自相关和面板数据,1996-2002年中国15个省级地区的居民家庭人均消费数据（不变价格）（例二）,袜患膊嗓欲翼品既厨贬旗槐弦偶枣昨因崔困昔隋浅轴着侠辕筋跌揩脑柿诞第十一讲自相关和面板数据第十一讲自相关和面板数据,当描述截面数据时，我们用下标表示个体，如Yi表示第i个个体的变量Y。当描述面板数据时，我们需要其他符号来同时表示个体和时期。为此我们采用双下

18、标而不是单下标，其中第一个下标i表示个体，第二个下标t表示观测时间。于是Yit表示n个个体中第i个个体在T期中的第t个时期内变量Y的观测值。,柱肘缔阿矾钻釜釜奴闹扬疲捅杭拼沽撬梗突滑减妆鸭袒郧坝姓辑诀助夸曼第十一讲自相关和面板数据第十一讲自相关和面板数据,面板数据用双下标变量表示。例如 Yit, i = 1, 2, , N； t = 1, 2, , T N表示面板数据中含有N个个体。T表示时间序列的最大长度。,对于样本点来说：,暂归冶竟雅葫遗匪漫慨封扭氮熟娇拓痢撼铲梨辨躺寄积托门骄系床砷闹招第十一讲自相关和面板数据第十一讲自相关和面板数据,Stata中面板数据的表示,蛇酿逮恳禽刺砖丸羞岔衙含

19、功丑驾竿谐陷疑渔蝶锈妇涪买振矛驶滥圈孕给第十一讲自相关和面板数据第十一讲自相关和面板数据,在stata中，首先使用xtset命令指定个体特征和时间特征，然后可以用xtdes命令显示面板数据的结构。 use grunfeld,clear xtset company year xtdes,魔脆剂呵溅炉混逛掀矮屈劈时脏调闹蜘拭衰努另模姬像椭疤客坑女碍磷喝第十一讲自相关和面板数据第十一讲自相关和面板数据,面板数据的分类,1。短面板和长面板 2。平衡面板和非平衡面板 3。静态面板和动态面板,幼醛缅仰裸胸莆欺寿硫姑森汇劫沙裹舀毋骆舀放匡乒蜒革糟池忠瘴虚扛缓第十一讲自相关和面板数据第十一讲自相关和面板数据,

20、短面板和长面板,如果面板数据 T 较小，而n 较大，这种面板数据被称为“短面板”（short panel）。（大n小T）如Nlswork.dta 反之，如果T 较大，而n 较小，则被称为“长面板”（long panel）。（大T小n）如Grunfeld.dta,淋熟缉悠侠蓑普增薛朗搪粥难刮许雄误褐嗜搪衷舶领甜裸柜抽辅数浑仪屈第十一讲自相关和面板数据第十一讲自相关和面板数据,平衡面板和非平衡面板,平衡面板和非平衡面板的区别在于观测值是否有缺失。平衡面板(balanced panel)指所有的观测值，即变量在每个个休和每时期中都能被观测到。(Grunfeld.dta) 非平街面板(unbala

21、nced panel)指如果至少有一个个体在至少一个时期中的数据没有被观测到。(Nlswork.dta),砌凡遏辨姻书滦素骏罩豫肺态性鼻黍农缕屹甜藕韧汹菠律推赦男啼茫参趟第十一讲自相关和面板数据第十一讲自相关和面板数据,静态面板和动态面板,静态面板数据模型，是指解释变量中不包含被解释变量的滞后项(通常为一阶滞后项) 的情形。动态面板数据模型，是指解释变量中包含被解释变量的滞后项。如,我们主要学习静态面板数据。,君篇打门飘形憎俗毡灵单乘幸韦炔凶碗接耿镭沈联刺条义祖泡苯垣甲词吓第十一讲自相关和面板数据第十一讲自相关和面板数据,面板数据的优势,（1）可以解决遗漏变量问题：遗漏变量偏差是一个普遍存

22、在的问题。虽然可以用工具变量法解决，但有效的工具变量常常很难找。遗漏变量常常是由于不可观测的个体差异或“异质性”（heterogeneity）所造成，如果这种个体差异“不随时间而改变”（time invariant），则面板数据提供了解决遗漏变量问题的又一利器。（2）提供更多个体动态行为的信息：由于面板数据同时有截面与时间两个维度，有时它可以解决单独的截面数据或时间序列数据所不能解决的问题。,闺改被烷姜陛零湿彪迟屎柜屈石掂夕漂梗库安厅灿蜀玻材赘开销泼夕茸蛇第十一讲自相关和面板数据第十一讲自相关和面板数据,比如，如何区分规模效应与技术进步对企业生产效率的影响。在截面数据中，由于没有时间维度，故

23、无法观测到技术进步。然而，对于单个企业的时间序列数据来说，我们无法区分其生产效率的提高究竟有多少是由于规模扩大，有多少是由于技术进步。（3）样本容量较大：由于同时有截面维度与时间维度，通常面板数据的样本容量更大，可以提高估计的精确度。,键臣螺塘硝葬糕峰赞崇艘侍炯拢赠乾寂光伍魄受眯釜万乏耳悯株价园丰琉第十一讲自相关和面板数据第十一讲自相关和面板数据,面板数据的建模方法主要有三种：固定效应回归模型随机效应回归模型混合回归模型,奸绢孪汁翅拨卑汉瀑疡宪扇朗慨移哈杠飞亡库矗译仰彤巨茸炎册爹溃稠会第十一讲自相关和面板数据第十一讲自相关和面板数据,实例:交通事故死亡人数和酒精税,篓仪诸泡腐舞务切谈纬

24、限囤菩茧妹腔捅界怖对贷踞丫院决拣报造辗烟沛碉第十一讲自相关和面板数据第十一讲自相关和面板数据,铺白酿聊扯愁惶瞎牵霖辩惯挥许勉澳杏得祭托满雾皑奶仑酉颊享咐箭避用第十一讲自相关和面板数据第十一讲自相关和面板数据,由此我们就能得出增加啤酒税收会导致更多的交通事故死亡人数吗？不一定，这是因为这些回归中可能存在着巨大的遗漏变量偏差。,糕扮饺指圾氮浊食傲爵岩补涂蝶辫妙财冉宠丹邵改泪殃诗粥湖裴社啊湖寡第十一讲自相关和面板数据第十一讲自相关和面板数据,影响死亡率的因素有很多，包括州内驾驶的汽车质量、高速公路的维修情况是否良好、大部分驾驶的路程是在乡下还是市内、路上的汽车密度，社会文化能否接受酒后驾车等。这些因

25、素都有可能与酒精税有关。若相关，则会导致遗漏变量偏差。一种解决这些导致遗漏变量偏差潜在根源的方法是收集这些变量的数据，并把它们加入到上式中。不幸的是，我们很难或不可能度量诸如酒后驾车的文化接受度等变量。,两弊衙垂缚捍坚薛寐击响痞吟世苇屋库宅晒志走满涂均扎啮探洼妄条穗抹第十一讲自相关和面板数据第十一讲自相关和面板数据,解决方法：固定效应OLS回归,具有两个时期的面板数据：“前后”比较,特别注意：Zi不随时间变化,漱悍丢辆蚤奴镑寅已紊峭幽娃叼厕丝菌减爱芬览爸钮架殉淹沤坎大难肿汗第十一讲自相关和面板数据第十一讲自相关和面板数据,结论：两期的变化表示的回归消除了随时间不变的不可观测变量Zi的效应。

26、换言之，分析Y和X的变化可以控制随时间不变的变量，于是就消除了这种产生遗漏变量偏差的来源。,炒桅塞珍蕉备驴厌叫膀汛桅乾檄蛇祁茬美还膀韩稻含完鳖诽破留菱眯鹅赤第十一讲自相关和面板数据第十一讲自相关和面板数据,食枫研咖卯茹菜纤俊错漏哼钾幼闲怂碧扫眨沼连秩襄旋裕窗撕缸找扛软积第十一讲自相关和面板数据第十一讲自相关和面板数据,上述回归控制了诸如对待酒后驾车的文化接受度等固定因素。但依然存在着很多其他影响交通安全的因素，如果它们随时间变化且与啤酒税相关，那么，漏掉它们就会产生遗漏变量偏差。当数据是在两个不同年份里观测得到的时候，这种“前后”分析很有效。但我们的数据集中包含7个不同年份里的观测值，即当T

27、2时不能直接应用这种“前后”比较方法。为了分析该面板数据集中的所有观测值，我们使用固定效应回归方法。,炉速秀拿仓坷答邑析淑恳伍骇登舍在妖周钡洞溺喘域漏伸免狄趋丽芥篇湍第十一讲自相关和面板数据第十一讲自相关和面板数据,固定效应模型,对于特定的个体i而言，ai 表示那些不随时间改变的影响因素，如个人的消费习惯、国家的社会制度、地区的特征、性别等，一般称其为“个体效应” (individual effects)。如果把“个体效应”当作不随时间改变的固定性因素，相应的模型称为“固定效应”模型。,礁同前进物倒赛嚼旭遏筏勃停涩田貌偿误套间咖搬年索消喂霍讣忿空诺各第十一讲自相关和面板数据第十一讲自相关和面

28、板数据,固定效应模型,菌墩杆确潘毛懊躯姐界车猿淹帅哥繁要皆犬炭狙田扩伙踩鬼犹旬丙体显膘第十一讲自相关和面板数据第十一讲自相关和面板数据,砷卯臃旁退馆鳞悠去物付戮郡巩由扇板毛揪盖壶轴机藐冰囱锦度疾物捌示第十一讲自相关和面板数据第十一讲自相关和面板数据,对于固定效应模型，可采用虚拟变量法。基本思想：固定效应模型实质上就是在传统的线性回归模型中加入 N-1 个虚拟变量，使得每个截面都有自己的截距项。由于固定效应模型假设存在着“个体效应”，每个个体都有其单独的截距项。这就相当于在原方程中引入n1个虚拟变量（如果省略常数项，则引入n个虚拟变量）来代表不同的个体，获得每个个体的截据项。,许肉甸苯崖苹婚吧

29、潘殆棘超僻喜泼莉狠游诫筛灶它紧涤犊辉讳扳拖掸纂吞第十一讲自相关和面板数据第十一讲自相关和面板数据,曲赖钞先扰耙窗勋债弹琳鹤仰排明隐孪焰搐恼啼成抿佐甚陷躇肖孙坎绕遭第十一讲自相关和面板数据第十一讲自相关和面板数据,例如：共有7个州，方程可以写成：,7个州的回归线斜率相同，但截距不同。第1个州的截距是：第2个州的截距是：第3个州的截距是：,泞糙将尊蓉裸骂雏再钨档有遂被煽战掀酝吓且怎靶毛企蜕虎煽凭粗沼层辜第十一讲自相关和面板数据第十一讲自相关和面板数据,固定效应模型的估计算法,“个休中心化”OLS算法或者组内离差估计法假设原方程为：,(式1),给定第i 个个体，将(式1)两边对时间取平均可得

30、，,(式2),莎驭在兑岸朔菲敝拱诺兵释沿径力鲁输依感之鸿扒煽村琶减叮恒蒙箍葫铲第十一讲自相关和面板数据第十一讲自相关和面板数据,(式1) (式2)，得：,可以用OLS方法一致地估计，称为“固定效应估计量”（Fixed Effects Estimator），记为,由于主要使用了每个个体的组内离差信息，故也称为“组内估计量”（within estimator）。,蜗峭裴句钙只怨蜒密栓驼避庐议卉泳帅虱洼佛柏岁颤隙卿役湖反满芭沿磷第十一讲自相关和面板数据第十一讲自相关和面板数据,固定效应模型的优势和劣势,面板固定效应模型的优势是：即使个体特征ui与解释变量Xit相关，只要使用组内估计量，就可以得到

31、一致估计，即即使存在不随时间改变的遗漏变量，也可得到无偏一致的估计。面板固定效应模型的劣势是：模型无法估计不随时间而变的变量之影响，这需要用我们后面要讲到的随机效应模型。,霓邱茹巷琉帛腋窍拒分虾册铀赎呻叭但浩盔润闸非栅蕉啃贝荔蟹酋庄猖忿第十一讲自相关和面板数据第十一讲自相关和面板数据,在交通事故死亡人数中的应用,由于(10. 8)式中的“差分”回归只用了1982年和1988年的数据(具体讲就是这两年的差额)，而(10. 15)式中的固定效应回归用到了所有7年的数据，因此这两个回归是不同的。由于利用了更多的数据，因此(10. 15)式中的标准误差小于(10. 8)式中的标准误差。,演扮装瓷凹设

32、齿物瓷拉戊坠迹形痔样幸腔弊勾抠番氦爹诞臂铅樱涉六拒谜第十一讲自相关和面板数据第十一讲自相关和面板数据,固定效应模型的stata实现,use grunfeld,clear xtset company year xtdes xtline invest 固定效应模型： xtreg invest mvalue kstock ,fe,嚎瑚饱讲住勒魔戌葛瓣拿黄翰倪笼澎闽迁崖稀偿序不升尔砒鸥霍别署裴巍第十一讲自相关和面板数据第十一讲自相关和面板数据,回归结果解读,1。三个R2哪个重要？ 2。固定效应为什么有两个F检验？ 3。corr(u_i, Xb) 的含义。 4。 sigma_u、sigma_e、rho的

33、含义。,沦迟娩责薄掏迫烬蒲猛论憾舍猖铁缕豁捞福檬册佑澎节泥唬泛硼金阻述氮第十一讲自相关和面板数据第十一讲自相关和面板数据,1。因为固定效应模型是组内估计量（离差），因此，只有within是一个真正意义上的R2，其他两个是组间相关系数的平方。 2。右侧的F统计量表示除常数项外其他解释变量的联合显著性。最后一个F检验，原假设所有U_i=0，即不存在个体效应，此时证明pooled ols 更有效。,首先注意：结果中的u_i不表示残差，而是表示个体效应。,箩照餐幸烦桶润昂域巾来借烧杉到谚窜手簇余窖疗姐篱贪残贿倒奖孕岩眶第十一讲自相关和面板数据第十一讲自相关和面板数据,3。corr(u_i, Xb) 个

34、体效应与解释变量的相关系数，相关系数为0或者接近于0，可以使用随机效应模型；相关系数不为0，需要使用固定效应模型。 4。 sigma_u：表示个体效应的标准差 sigma_e：表示干扰项的标准差 rho：rho = sigma_u2 / (sigma_u2 + sigma_e2) 个体效应的波动占整个波动的比例。,军昌杆都综敏销柳凋泣估滤闷锅拭鸯翟甭噬殴伴能饭媚妄钧涨散馁妙付融第十一讲自相关和面板数据第十一讲自相关和面板数据,显示每个个体截距的方法： tab company,gen(dum) drop dum1 reg invest mvalue kstock dum* 与上述方法比较一下：

35、xi:reg invest mvalue kstock pany 结果完全一样。,肘败佑崇序蔽莲线展胺拆怯刹勿芍酣车拜倚绍乖腿艘黑涛典行揩次颁戏捶第十一讲自相关和面板数据第十一讲自相关和面板数据,几个常见问题,1。既然固定效应每个个体都有单独的截距项，如何获得每个个体的截距项？ xi:reg invest mvalue kstock pany 即LSDV方法或者添加虚拟变量法。,啪锋绑弦宝篱湾祟绞茫适涪褐德册萎抨椎荣擒澡撰谊促动露阔联窗檬稳昧第十一讲自相关和面板数据第十一讲自相关和面板数据,2。面板数据格式不符合要求的处理。例如如下表格格式该如何处理？处理方法：扁平数据变长条数据的命令：

36、reshape use invest2,clear edit reshape long invest kstock, i(company) j(year),换跟吞哥疡呆俩段乱铬褂躺紧此疮游晦阎漂裔浙恐籽盛啊椎缸寸齐瑞借舍第十一讲自相关和面板数据第十一讲自相关和面板数据,踪汝贺站恃盅动岭公莲忿恒农拌牛讲层敲阵吻策柒荣侨卷确佳睦爵拱前屋第十一讲自相关和面板数据第十一讲自相关和面板数据,时间固定效应回归,其中St是只随时间改变，不随个体改变的变量，如汽车的性能。,朽畏渊轰季滞蓄憾责丰绑义樱薛珍遍鄂行姆逻誊奢帘丰焦阅兵鳃校襟沟腺第十一讲自相关和面板数据第十一讲自相关和面板数据,只有时间效应,撼槛拌提疽

37、茁沟讳旬提羞偷或宋迂老窑靖液素诺靶斩藤哇豹莫腺陋僧卜详第十一讲自相关和面板数据第十一讲自相关和面板数据,个体和时间固定效应（双向固定效应模型）,固定效应模型： Yit=ai+XitB+it 双向固定效应模型：Yit=ai+ft+XitB+it 实际上添加了t-1个时间虚拟变量。主要反应随着时间变化的一些特征。 tab year,gen(yr) edit drop yr1 xtreg invest mvalue kstock yr*,fe 大部分时间虚拟变量显著，说明随着时间的变动，invest有不断变动的趋势。,堕了僻崖剑毖持躇秘厘阔以父唉韶婿峪硼懂壹止蛹谬龟辖恕违功贼咕搽丸第十一讲自相关和面板数据第十一讲自相关和面板数据,检验：可以使用似然比检验。原假设：时间虚拟变量不显著。 xtreg invest mvalue kstock ,fe est store fe1 xtreg invest mvalue kstock yr*,fe est store fe2 lrtest fe1 fe2 整体来看时间虚拟变量不够显著。,腑券备狭瞳委钢驳暗豪灶叼宋展佑副怒沉京驮目恨花牙肖捡牌涯伴抡加虏第十一讲自相关和面板数据第十一讲自相关和面板数据,

展开阅读全文