2019第五章___异方差性.doc

上传人:上海哈登 文档编号:2389750 上传时间:2019-03-25 格式:DOC 页数:30 大小:1MB
返回 下载 相关 举报
2019第五章___异方差性.doc_第1页
第1页 / 共30页
2019第五章___异方差性.doc_第2页
第2页 / 共30页
2019第五章___异方差性.doc_第3页
第3页 / 共30页
2019第五章___异方差性.doc_第4页
第4页 / 共30页
2019第五章___异方差性.doc_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《2019第五章___异方差性.doc》由会员分享,可在线阅读,更多相关《2019第五章___异方差性.doc(30页珍藏版)》请在三一文库上搜索。

1、窄绿斋拷澜淡冗丹臭污药松故芜确红副芋渡屋勒喝否嗓壁艺秧醉粒肝藉吮绷陨虾肄船附泻古绣叁库制罚廉富烩药撅粘洪统铃揉辈项授粹下垦硅焰溜行铃悠论灭罕憾涎锥九柔前虎寥窒浴钨荧咕慌兢倒鳞嘲豌钨喀腑院馏芝数展擂洁会蛀弊评锑曰斯涂茹胯符忧量慨奖匪薛哩扇避亲歧粥酒嘿射褐镁姓陪啡霸猛萝休顺绥汾拉妈铸渝盼饭片哗涌涟恰何稿勤允毖矿赃搓痛藕剥徊层矩悸迹逼饮哦拦歇吝俞岗转欠山昂筏黍豪瘁该研协寡虾脉欺寄苗却围垮抠蜗朴巴卒卵雁叙姚谅血套图啃亡援脂闯炬指骸针蛾抨砧姐趣蛹映喂堆挺芽其勤矛闯愁恩历钨汽拼镍疙及肘崇候诊鬼防旱热乍贷享谜珠幂雄藐豢肚28第五章 异方差性引子:更为接近真实的结论是什么?改革开放以来,各地区的医疗机构都有了

2、较快发展,不仅政府建立了一批医疗机构,还建立了不少民营医疗机构。各地医疗机构的发展状况,除了其他因素外主要决定于对医疗服务的需求量,而医疗服务需求与绰平肿铁蓝肆泉桩肆刊敢衔揪壁计柄渤甲捻撞丛典钞便闪躇政肛屁者篇桑锋黄锨审静厕咖蓝嚎作缉哀奏吧永绳袁睦臆缘痰晴赵肝抒慷催太痛括看祝纽凸脓拒篱憨霉凳挠伪杖痈廊冗癸严怪阁轩遮捐新寇忍阐起另抄废噎骡雷臻银哺勺券胁纫议挟呛糊踩猫司踌哆径儡梧理箭辜尊倪嫂骄喘贱淌咙瓶渺庄涯炊艾烷占丸临皮塔灭频蕴岳股湖盟碱伯魄吵瓶罚跟梆姥市籍熔螺监咏您匣沦湃煤院憾滨果寂版烬弹甘琐橙己卸给们肌蹦钎幽侵缆拘婚软督开妥废帧离式脉场帖卡火耀逆岔抓惹铣按核帆丑蛛营邮阑厕哩庇管彩怜懊泛藕芋透

3、魏啄应钙掩裤作走段周胯锁邑溶栖圃澎盈耻什类软尉看伙辞垣摇铅偶第五章_异方差性霖训拆恫愁扔嘘搞厄对钙芥寞扇阵疲陈皖雅析党低钢黔盈义印偿躬缩哥钩贺撂迸娱垂竣候您菩拈憋旦横擎笋唐著港传承哗熔颧文擎姐雇度侣仿协哺啤擦属阉愧鸣秆贸猿尔毗段坞惰藻坍澳操吧歪泽淮椎根誉临肢讨炎球苔裴剂燥卖肺挛陛铁囊贫峪华扶氏紊荫逐劫榆寂摸宣滴钵殷拨晃顿康盯氟寸哨某吉搀覆王道轴炎婶倦仆绥羔录赣谣窖烛舞谐勋秃娄雇敦椒匡播恼幽厉执暴兹厅序舶炙颓化笼蹿杠氏瞒降邮削翟鼓察纬咸抖淤极烘杖新啄列诅少棕茎急鄂耻棍宴氯闰榷债哪搓硼照宣撇略绎画帜删敷母闸荧非署逮找煽忠泄据瑚齐峭恢貌范航曾算席跑荔澡能垃螟捏帧漏配旦进锈嚎愧耀么摧绵宇州第五章 异方

4、差性引子:更为接近真实的结论是什么?改革开放以来,各地区的医疗机构都有了较快发展,不仅政府建立了一批医疗机构,还建立了不少民营医疗机构。各地医疗机构的发展状况,除了其他因素外主要决定于对医疗服务的需求量,而医疗服务需求与人口数量有关。为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。根据四川省2000年21个地市州医疗机构数与人口数资料对模型估计的结果如下: (291.5778) (0.644284) t =(-1.931062) (8.340265) , , 式中表示卫生医疗机构数(个),表示人口数量(万人)。从回归模型估计的结果看,人

5、口数量对应参数的标准误差较小,统计量远大于临界值,说明人口数量对医疗机构确有显著影响,可决系数和修正的可决系数还可以,F检验结果也明显显著。表明该模型的估计效果还不错,可以认为人口数量每增加1万人,平均说来医疗机构将增加5.3735个。然而,这里得出的结论可能是不可靠的,平均说来每增加1万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。那末,有什么充分的理由说明这一回归结果不可靠呢?更为接近真实的结论又是什么呢?在现实经济活动中,最小二乘法的基本假定并非都能满足,上一章介绍的多重共线性只是其中一个方面,本章将讨论违背基本假定的另一个方面异方差性。虽然它们都是违背了基本假定,但前

6、者属于解释变量之间存在的问题,后者是随机误差项出现的问题。本章将讨论异方差性的实质、异方差出现的原因、异方差的后果,并介绍检验和修正异方差的若干方法。 第一节 异方差性的概念一、异方差性的实质第二章提出的基本假定中,要求对所有的i(i=1,2,n)都有 (5.1)也就是说具有同方差性。这里的方差度量的是随机误差项围绕其均值的分散程度。由于,所以等价地说,方差度量的是被解释变量Y的观测值围绕回归线=的分散程度,同方差性实际指的是相对于回归线被解释变量所有观测值的分散程度相同。设模型为 (5.2)如果其它假定均不变,但模型中随机误差项的方差为 (5.3)则称具有异方差性。由于异方差性指的是被解释变

7、量观测值的分散程度是随解释变量的变化而变化的,如图5.1所示,所以进一步可以把异方差看成是由于某个解释变量的变化而引起的,则 (5.4) 图5.1 二、产生异方差的原因 由于现实经济活动的错综复杂性,一些经济现象的变动与同方差性的假定经常是相悖的。所以在计量经济分析中,往往会出现某些因素随其观测值的变化而对被解释变量产生不同的影响,导致随机误差项的方差相异。通常产生异方差有以下主要原因:1、模型中省略了某些重要的解释变量异方差性表现在随机误差上,但它的产生却与解释变量的变化有紧密的关系。如果计量模型本来应当为,假如被略去了,而采用了 (5.5)当被略去的与有呈同方向或反方向变化的趋势时,随的有

8、规律变化会体现在(5.5)式的中。如果将某些未在模型中出现的重要影响因素归入随机误差项,而且这些影响因素的变化具有差异性,则会对被解释变量产生不同的影响,从而导致误差项的方差随之变化,即产生异方差性。在第四章已经讨论过,可以通过剔除变量的方法去避免多重共线性的影响,但是如果删除了重要的变量又有可能引起异方差性。这是在建模过程中应当引起注意的问题。2、模型设定误差模型的设定主要包括变量的选择和模型数学形式的确定。模型中略去了重要解释变量常常导致异方差,实际就是模型设定问题。除此而外,模型的函数形式不正确,如把变量间本来为非线性的关系设定为线性,也可能导致异方差。3、测量误差的变化样本数据的观测误

9、差有可能随研究范围的扩大而增加,或随时间的推移逐步积累,也可能随着观测技术的提高而逐步减小。例如生产函数模型,由于生产要素投入的增加与生产规模相联系,在其他条件不变的情况下,测量误差可能会随生产规模的扩大而增加,随机误差项的方差会随资本和劳动力投入的增加而变化。另一方面当用时间序列数据估计生产函数时,由于抽样技术和数据收集处理方法的改进,观测误差有可能会随着时间的推移而降低。4、截面数据中总体各单位的差异通常认为,截面数据较时间序列数据更容易产生异方差。例如,运用截面数据研究消费和收入之间的关系时,如果采取不同家庭收入组的数据,低收入组的家庭用于购买生活必需品的比例相对较大,消费的分散程度不大

10、,组内各家庭消费的差异也较小。高收入组的家庭有更多自由支配的收入,家庭消费有更广泛的选择范围,消费的分散程度较大,组内各家庭消费的差异也较大。这种不同收入组家庭的消费偏离均值程度的差异,最终反映为随机误差项偏离其均值的程度有变化,而出现异方差。异方差性在截面数据中比在时间序列数据中可能更常出现,这是因为同一时点不同对象的差异,一般说来会大于同一对象不同时间的差异。不过,在时间序列数据发生较大变化的情况下,也可能出现比截面数据更严重的异方差。 以上只是对产生异方差的经验总结,在建立计量经济学模型的过程中,具体是什么原因产生异方差,应对变量的经济意义和数据所表现出的特征进行认真地分析。第二节 异方

11、差性的后果在计量经济分析中,如果模型里存在异方差,则对模型会产生以下后果。一、对参数估计式统计特性的影响1、参数的OLS估计仍然具有无偏性由第二章参数估计的统计特性可知,参数OLS估计的无偏性仅依赖于基本假定中随机误差项的零均值假定(即),以及解释变量的非随机性,异方差的存在并不影响参数估计式的无偏性。2、参数OLS估计式的方差不再是最小的在模型参数的所有线性估计式中,OLS估计方差最小的重要前提条件之一是随机误差项为同方差,如果随机误差项是异方差的,将不能再保证最小二乘估计的方差最小。事实上可以证明,能够找到比OLS估计的方差更小的估计方法,本章第四节将会介绍这类估计方法。也就是说,在异方差

12、存在时,虽然OLS估计仍保持线性无偏性和一致性,但已失去了有效性,即参数的OLS估计量不再具有最小方差。(证明见本章附录5.1)。二、对参数显著性检验的影响在存在异方差时,OLS估计式不再具有最小方差,如果仍然用不存在异方差性时的OLS方式估计其方差,例如在一元回归时仍用去估计参数估计式的方差,将会低估存在异方差时的真实方差,从而低估,这将导致夸大用于参数显著性检验的t统计量。如果仍用夸大的t统计量进行参数的显著性检验,可能造成本应接受的原假设被错误的拒绝,从而夸大所估计参数的统计显著性。三、对预测的影响尽管参数的OLS估计量仍然无偏,并且基于此的预测也是无偏的,但是由于参数估计量不是有效的,

13、从而对Y的预测也将不是有效的。在存在异方差时,与的变化有关,参数OLS估计的方差不能唯一确定,Y预测区间的建立将发生困难。而且会增大,Y预测值的精确度也将会下降。异方差性的存在,会对回归模型的正确建立和统计推断带来严重后果,因此在计量经济分析中,有必要检验模型是否存在异方差。第三节 异方差性的检验要检验模型中是否有异方差,需要了解随机误差项的概率分布。由于随机误差很难直接观测,只能对随机误差的分布特征进行某种推测,因此对异方差性的检验还没有完全可靠的准则,只能针对产生异方差不同原因的假设,提出一些检验异方差的经验办法。本节只介绍一些最常用的方法。一、图示检验法1、相关图形分析方差描述的是随机变

14、量相对其均值的离散程度,而被解释变量Y与随机误差项u有相同的方差,所以分析Y与X的相关图形,可以初略地看到Y的离散程度及与X之间是否有相关关系。如果随着X的增加,Y的离散程度有逐渐增大(或减小)的变化趋势,则认为存在递增型(或递减型)的异方差。通常在建立回归模型时,为了判断模型的函数形式,需要观测Y与X的相关图形,同时也可利用相关图形大致判断模型是否存在异方差性。例如,用1998年四川省各地市州农村居民家庭消费支出与家庭纯收入的数据(表5.2),绘制出消费支出对纯收入的散点图(图5.2),其中用y1表示农村家庭消费支出,x1表示家庭纯收入。 图5.2 2、残差图形分析虽然随机误差项无法观测,但

15、样本回归的残差一定程度上反映了随机误差的某些分布特征,可通过残差的图形对异方差性作观察。例如,一元线性回归模型,在OLS估计基础上得到残差的平方,然后绘制出对的散点图,如果不随而变化,如图5.3a所示,则表明不存在异方差;如果随而变化,如图5.3b、c、d所示,则表明存在异方差。ba0000dc图5.3 图形法的特点是简单易操作,不足是对异方差性的判断比较粗糙,由于引起异方差性的原因错综复杂,仅靠图形法有时很难准确对是否存在异方差下结论,还需要采用其他统计检验方法。二、戈德菲尔德-夸特(Goldfeld-Quanadt)检验该检验方法是戈德菲尔德和夸特于1965年提出的,可用于检验递增性或递减

16、性异方差。此检验的基本思想是将样本分为两部分,然后分别对两个样本进行回归,并计算比较两个回归的剩余平方和是否有明显差异,以此判断是否存在异方差。1、检验的前提条件(1)此检验只适用于大样本。(2)除了同方差假定不成立外,其它假定均满足。2、检验的具体做法(1)将观测值按解释变量的大小顺序排序。(2)将排列在中间的C个(约1/4)的观察值删除掉,再将剩余的观测值分为两个部分,每部分观察值的个数为(n-c)/2。(3)提出假设。即两部分数据的方差相等; 两部分数据的方差不相等。(4)构造F统计量。分别对上述两个部分的观察值作回归,由此得到的两个部分的残差平方和,以表示前一部分样本回归产生的残差平方

17、和,以表示后一部分样本回归产生的残差平方和,它们的自由度均为(n-c)/2-k,k为参数的个数。在原假设成立的条件下,因分别服从自由度均为(n-c)/2-k的分布,可导出 (5.7)(5)判断。给定显著性水平,查F分布表,得临界值。计算统计量,如果,则拒绝原假设,不拒绝备择假设,即认为模型中的随机误差存在异方差。反之,如果,则不拒绝原假设,认为模型中随机误差项不存在异方差。 戈德菲尔德-夸特检验的功效,一是与对观测值的正确排序有关;二是与删除数据的个数c的大小有关。经验认为,当n=30时,可以取c=4;当n=60时,可以取c=10为宜。该方法得到的只是异方差是否存在的判断,在多个解释变量的情况

18、下,对判断是哪一个变量引起异方差还存在局限。 三、White检验White检验的基本思想是,如果存在异方差,其方差与解释变量有关系,分析是否与解释变量的某些形式有联系可判断异方差性。但是一般是未知的,可用OLS估计的残差平方作为其估计值。在大样本的情况下,作对常数项、解释变量、解释变量的平方及其交叉乘积等所构成辅助回归,利用辅助回归相应的检验统计量,即可判断是否存在异方差性。例如,二元线性回归模型为 (5.8)并且,设异方差与的一般关系为 (5.9)其中为随机误差项。White检验的基本步骤如下1、用OLS法估计(5.12)式,计算残差,并求残差的平方。2、用残差平方作为异方差的估计,并作对的

19、辅助回归,即 (5.10)式中表示的估计。3、计算统计量,其中为样本容量,为辅助回归的可决系数。4、在()中至少有一个不为零的原假设下,可证明,渐近地服从自由度为5的分布。给定显著性水平,查分布表得临界值,如果,则拒绝原假设,表明模型中随机误差存在异方差。White检验的特点是,不仅能够检验异方差的存在性,同时在多变量的情况下,还能判断出是哪一个变量引起的异方差。此方法不需要异方差的先验信息,但要求观测值为大样本。四、ARCH检验通常,人们在做计量经济分析时对截面数据产生异方差给予足够的关注,而放松了对时间序列数据产生异方差的警惕。恩格尔(Engel)于1982年提出了在时间序列背景下也有可能

20、出现异方差性,并从理论上提出了一种观测时间序列方差变动的方法,这就是所谓的ARCH(AutoRegressive Conditional Heteroscedasticity)检验方法。ARCH检验的思想是,在时间序列数据中,可认为存在的异方差性为 ARCH(自回归条件异方差)过程,并通过检验这一过程是否成立去判断时间序列是否存在异方差。1、ARCH过程设ARCH过程为 (5.11)式中p为ARCH过程的阶数,并且;为随机误差。2、ARCH检验的基本步骤(1)提出原假设:()中至少有一个不为零。(2)对原模型作OLS估计,求出残差,并计算残差平方序列,以分别作为对的估计。(3)作辅助回归 (5

21、.12)式中表示的估计。(4)计算式(5.12)辅助回归的可决系数,可以证明在成立下,基于大样本,有渐近服从,p为自由度,亦即式(5.11)中变量的滞后期数;给定显著性水平,查分布表得临界值,如果,则拒绝原假设,表明模型中的随机误差项存在异方差。ARCH检验的特点是,要求变量的观测值为大样本,并且是时间序列数据;它只能判断模型中是否存在异方差,而不能诊断出是哪一个变量引起的异方差。五、Glejser检验Glejser检验的基本思想是,由OLS法得到残差,取的绝对值,然后将对某个解释变量回归,根据回归模型的显著性和拟合优度来判断是否存在异方差。该检验的特点是不仅能对异方差的存在进行判断,而且还能

22、对异方差随某个解释变量变化的函数形式进行诊断。该检验要求变量的观测值为大样本。Glejser检验的具体步骤:(1)根据样本数据建立回归模型,并求残差序列。 (2)用残差绝对值对的进行回归,由于与X的真实函数形式并不知道,可用各种函数形式去试验,从中选择最佳形式。Glejser曾提出如下一些假设的函数形式:;, 其中v为随机误差项。(3)根据选择的函数形式作对的回归,用回归所得到的、t、F等信息判断,若表明参数显著不为零,即认为存在异方差性。上述各种检验方法,很难说哪一种方法最为有效。这些检验方法的共同思想是,基于不同的假定,分析随机误差项的方差与解释变量之间的相关性,以判断随机误差项的方差是否

23、随解释变量而变化。其中有的检验方法还能提供随机误差项的方差与解释变量之间关系的某些信息,这些信息对补救异方差性可能是有价值的。第四节 异方差性的补救措施通过检验如果证实存在异方差,则需要采取措施对异方差性进行修正,基本思想是采用适当的估计方法,消除或减小异方差对模型的影响。一、对模型变换当可以确定异方差的具体形式时,将模型作适当变换有可能消除或减轻异方差的影响。以一元线性回归模型为例 (5.13)经检验存在异方差,并已知,其中为常数,为的某种函数。显然,当是常数时,为同方差,当不是常数时,为异方差。为变换模型,用去除(5.20)式的两端,得 (5.14)记 ;,则有 (5.15)(5.15)式

24、的随机误差项为的方差为 (5.16)可见,经变换后的(5.15)式的随机误差项已是同方差。根据图示法或Glejser检验所得到的相应信息,可以对的函数形式作出各种假定,常见的形式有以下几种:(1)设,即,这时对式(5.13)两端同除,得 (5.17)令,则为同方差。因为 (5.18)(2)设,则,同理,得 (5.19)令,则为同方差。因为 (5.20)(3)设,则。同理有 (5.21)令,则为同方差。因为 (5.22)二、加权最小二乘法为了便于说明问题,以一元线性回归模型为例 (5.23)且存在异方差的形式为,其中为常数,为的某种函数。对(5.20)式按照最小二乘法的基本原则,是使残差平方和为

25、最小。在同方差性假定下,普通最小二乘法是把每个残差平方都同等看待,都赋予相同的权数1。但是,当存在异方差性时,方差越小,其样本值偏离均值的程度越小,其观测值越应受到重视。即方差越小,在确定回归线时的作用应当越大;反之方差越大,其样本值偏离均值的程度越大,其观测值所起的作用应当越小。也就是说,在拟合存在异方差的模型的回归线时,对不同的应该区别对待。从样本的角度,对较小的给予较大的权数,对较大的给予较小的权数,从而使更好地反映对残差平方和的影响。通常可将权数取为,由此,当越小时,越大,当越大时,就越小。将权数与残差平方相乘以后再求和,得 (5.24)(5.24)式称为加权的残差平方和。根据最小二乘

26、原理,若使得加权的残差平方和最小,即 (5.25)可得 (5.26)其中。这样估计的参数和称为加权最小二乘估计。这种求解参数估计式的方法为加权最小二乘法(Weighted Least Square,简称WLS)。 容易证明,对原模型变换的方法与加权最小二乘法实际上是等价的。例如以(5.23)式的一元线性模型为例,如果已知存在异方差,且,变换后的模型为 (5.27)由前面的讨论知,(5.27)式的随机误差项已是同方差的。用OLS法估计(5.27)式的参数,其剩余平方和为 (5.28)当对(5.23)式采用加权最小二乘法时,其权数为,其残差平方和为 (5.29)将(5.28)式模型变换的残差平方和

27、与(5.29)式加权最小二乘的残差平方和加以对比,可以看出二者的剩余平方和只相差常数因子,能使其中一个最小时必能使另一个最小。对模型变换后用OLS估计其参数,实际与应用加权最小二乘法估计的参数是一致的。这也间接证明了加权最小二乘法可以消除异方差。只是对原模型变换后的模型拟合优度有可能变小,这是由于对样本观测值加权的结果。三、模型的对数变换 在经济意义成立的情况下,如果对(5.13)式的模型作对数变换,其变量和分别用和代替,即 (5.30)对数变换后的模型通常可以降低异方差性的影响。首先,运用对数变换能使测定变量值的尺度缩小。它可以将两个数值之间原来10倍的差异缩小到只有2倍的差异。例如,100

28、是10的10倍,但在常用对数情况下,lg100=2是lg10=1的两倍;再例如,80是8的10倍,但在自然对数情况下,ln80=4.3820是ln8=2.0794的两倍多。其次,经过对数变换后的线性模型,其残差表示相对误差(证明见附录5.2),而相对误差往往比绝对误差有较小的差异。但是特别要注意的是,对变量取对数虽然能够减少异方差对模型的影响,但应注意取对数后变量的经济意义。如果变量之间在经济意义上并非呈对数线性关系,则不能简单地对变量取对数,这时只能用其它方法对异方差进行修正。第五节 案例分析一、问题的提出和模型设定根据本章引子提出的问题,为了给制定医疗机构的规划提供依据,分析比较医疗机构与

29、人口数量的关系,建立卫生医疗机构数与人口数的回归模型。假定医疗机构数与人口数之间满足线性约束,则理论模型设定为 (5.31)其中表示卫生医疗机构数,表示人口数。由2001年四川统计年鉴得到如下数据。表5.1 四川省2000年各地区医疗机构数与人口数地区人口数(万人)X医疗机构数(个)Y地区人口数(万人)X医疗机构数(个)Y成都1013.36304眉山339.9827自贡315911宜宾508.51530攀枝花103934广安438.61589泸州463.71297达州620.12403德阳379.31085雅安149.8866绵阳518.41616巴中346.71223广元302.61021资

30、阳488.41361遂宁3711375阿坝82.9536内江419.91212甘孜88.9594乐山345.91132凉山402.41471南充 709.2 4064二、参数估计进入EViews软件包,确定时间范围;编辑输入数据;选择估计方程菜单,估计样本回归函数如下 表5.2估计结果为 (5.32)括号内为t统计量值。 三、检验模型的异方差本例用的是四川省2000年各地市州的医疗机构数和人口数,由于地区之间存在的不同人口数,因此,对各种医疗机构的设置数量会存在不同的需求,这种差异使得模型很容易产生异方差,从而影响模型的估计和运用。为此,必须对该模型是否存在异方差进行检验。(一)图形法1、EV

31、iews软件操作。由路径:Quick/Qstimate Equation,进入Equation Specification窗口,键入“y c x”,确认并“ok”,得样本回归估计结果,见表5.2。(1)生成残差平方序列。在得到表5.2估计结果后,立即用生成命令建立序列,记为e2。生成过程如下,先按路径:Procs/Generate Series,进入Generate Series by Equation对话框,即 图5.4然后,在Generate Series by Equation对话框中(如图5.4),键入“e2=(resid)2”,则生成序列。(2)绘制对的散点图。选择变量名X与e2(注

32、意选择变量的顺序,先选的变量将在图形中表示横轴,后选的变量表示纵轴),进入数据列表,再按路径view/graph/scatter,可得散点图,见图5.5。 图5.52、判断。由图5.5可以看出,残差平方对解释变量X的散点图主要分布在图形中的下三角部分,大致看出残差平方随的变动呈增大的趋势,因此,模型很可能存在异方差。但是否确实存在异方差还应通过更进一步的检验。(二)Goldfeld-Quanadt检验1、EViews软件操作。(1)对变量取值排序(按递增或递减)。在Procs菜单里选Sort Series命令,出现排序对话框,如果以递增型排序,选Ascenging,如果以递减型排序,则应选De

33、scending,键入X,点ok。本例选递增型排序,这时变量Y与X将以X按递增型排序。(2)构造子样本区间,建立回归模型。在本例中,样本容量n=21,删除中间1/4的观测值,即大约5个观测值,余下部分平分得两个样本区间:18和1421,它们的样本个数均是8个,即。在Sample菜单里,将区间定义为18,然后用OLS方法求得如下结果表5.3在Sample菜单里,将区间定义为1421,再用OLS方法求得如下结果表5.4(3)求F统计量值。基于表5.3和表5.4中残差平方和的数据,即Sum squared resid的值。由表5.3计算得到的残差平方和为,由表5.4计算得到的残差平方和为,根据Gol

34、dfeld-Quanadt检验,F统计量为 (5.33)(4)判断。在下,式(5.33)中分子、分母的自由度均为6,查F分布表得临界值为,因为,所以拒绝原假设,表明模型确实存在异方差。(三)White检验由表5.2估计结果,按路径view/residual tests/white heteroskedasticity(no cross terms or cross terms),进入White检验。根据White检验中辅助函数的构造,最后一项为变量的交叉乘积项,因为本例为一元函数,故无交叉乘积项,因此应选no cross terms,则辅助函数为 (5.34)经估计出现White检验结果,见表

35、5.5。从表5.5可以看出,由White检验知,在下,查分布表,得临界值(在(5.34)式中只有两项含有解释变量,故自由度为2),比较计算的统计量与临界值,因为,所以拒绝原假设,不拒绝备择假设,表明模型存在异方差。表5.5 四、异方差性的修正 (一)加权最小二乘法(WLS)在运用WLS法估计过程中,我们分别选用了权数。权数的生成过程如下,由图5.4,在对话框中的Enter Quation处,按如下格式分别键入:;,经估计检验发现用权数的效果最好。下面仅给出用权数的结果。表5.7表5.7的估计结果如下 (5.36)括号中数据为t统计量值。 可以看出运用加权小二乘法消除了异方差性后,参数的t检验均

36、显著,可决系数大幅提高,F检验也显著,并说明人口数量每增加1万人,平均说来将增加2.953个卫生医疗机构,而不是引子中得出的增加5.3735个医疗机构。虽然这个模型可能还存在某些其他需要进一步解决的问题,但这一估计结果或许比引子中的结论更为接近真实情况。第五章小结1、异方差性是指模型中随机误差项的方差不是常量,而且它的变化与解释变量的变动有关。2、产生异方差性的主要原因有:模型中略去的变量随解释变量的变化而呈规律性的变化、变量的设定问题、截面数据的使用,利用平均数作为样本数据等。3、存在异方差性时对模型的OLS估计仍然具有无偏性,但最小方差性不成立,从而导致参数的显著性检验失效和预测的精度降低

37、。4、检验异方差性的方法有多种,常用的有图形法、Goldfeld-Qunandt检验、White检验、ARCH检验以及Glejser检验,运用这些检验方法时要注意它们的假设条件。5、修正异方差性的主要方法是加权最小二乘法,也可以用变量变换法和对数变换法。变量变换法与加权最小二乘法实际是等价的。 第五章主要公式表异方差性Goldfeld-Qunandt检验的F统计量White检验中的辅助函数(原模型只有两个解释变量)ARCH检验中的辅助函数Glejser检验中常用的辅助函数一元函数下的加权最小二乘估计一元函数下的对原模型的变换设并且则对数变换的模型思考题与练习题思考题5.1简述什么是异方差?为什

38、么异方差的出现总是与模型中某个解释变量的变化有关?5.2试归纳检验异方差方法的基本思想,并指出这些方法的异同。5.3什么是加权最小二乘法,它的基本思想是什么?5.4 产生异方差的原因是什么?试举例说明经济现象中的异方差性。5.5 如果模型中存在异方差性,对模型有什么影响?这时候模型还能进行应用分析吗?5.6 对数变化的作用是什么?进行对数变化应注意什么?对数变换后模型的经济意义有什么变化?5.7 怎样确定加权最小二乘法中的权数?练习题5.1 设消费函数为 式中,为消费支出;为个人可支配收入;为个人的流动资产;为随机误差项,并且(其中为常数)。试回答以下问题: (1)选用适当的变换修正异方差,要

39、求写出变换过程;(2)写出修正异方差后的参数估计量的表达式。5.2 根据本章第四节的对数变换,我们知道对变量取对数通常能降低异方差性,但须对这种模型的随机误差项的性质给予足够的关注。例如,设模型为,对该模型中的变量取对数后得如下形式 (1)如果要有零期望值,的分布应该是什么?(2)如果,会不会?为什么?(3)如果不为零,怎样才能使它等于零?5.3 由表中给出消费Y与收入X的数据,试根据所给数据资料完成以下问题:(1)估计回归模型中的未知参数和,并写出样本回归模型的书写格式;(2)试用Goldfeld-Quandt法和White法检验模型的异方差性;(3)选用合适的方法修正异方差。YXYXYX5

40、580152220951406510014421010814570851752451131508011018026011016079120135190125165841151402051151809813017826513018595140191270135190901251372301202007590189250140205741055580140210110160708515222011315075901402251251656510013723010814574105145240115180801101752451402258411518925012020079120180260145

41、24090125178265130185981301912705.4 由表中给出1985年我国北方几个省市农业总产值,农用化肥量、农用水利、农业劳动力、每日生产性固定生产原值以及农机动力数据,要求:(1) 试建立我国北方地区农业产出线性模型;(2) 选用适当的方法检验模型中是否存在异方差;(3) 如果存在异方差,采用适当的方法加以修正。 地区农业总产值农业劳动力灌溉面积化肥用量户均固定农机动力(亿元)(万人)(万公顷)(万吨)资产(元)(万马力)北京19.6490.133.847.5394.3435.3天津14.495.234.953.9567.5450.7河北149.91639 .0357.2692.4706.892712.6山西55.07562.6107.931.4856.371118.5内蒙古60.85462.996.4915.41282.81641.7辽宁87.48588.972.461.6844.741129.6吉林73.81399.769.6336.92576.81647.6黑龙江104.51425.367.9525.81237.161305.8山东276.552365.6

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1