上海财经大学邹平金融计量学章节件.ppt

上传人:本田雅阁 文档编号:2633996 上传时间:2019-04-25 格式:PPT 页数:518 大小:6.45MB
返回 下载 相关 举报
上海财经大学邹平金融计量学章节件.ppt_第1页
第1页 / 共518页
上海财经大学邹平金融计量学章节件.ppt_第2页
第2页 / 共518页
上海财经大学邹平金融计量学章节件.ppt_第3页
第3页 / 共518页
上海财经大学邹平金融计量学章节件.ppt_第4页
第4页 / 共518页
上海财经大学邹平金融计量学章节件.ppt_第5页
第5页 / 共518页
点击查看更多>>
资源描述

《上海财经大学邹平金融计量学章节件.ppt》由会员分享,可在线阅读,更多相关《上海财经大学邹平金融计量学章节件.ppt(518页珍藏版)》请在三一文库上搜索。

1、1,第一章 金融计量学介绍,2,本章要点,金融计量学的方法论与应用步骤。 金融数据的特点和来源 金融计量学软件的使用,3,第一节 金融计量学的含义及建模步骤,一、金融计量学的含义 金融计量学就是把计量经济学中的方法和技术应用到金融领域,即应用统计方法和统计技术解决金融问题。,4,二、金融计量建模的主要步骤,经济理论或金融理论 建立金融计量模型 数据收集 模型估计 模型检验 不通过 通过 重新建立模型 模型的应用,5,第一步,把需要研究的金融问题模型化; 第二步,收集样本数据; 第三步,选择合适的估计方法来估计模型; 第四步,对模型进行检验; 第五步,对模型进行相应的应用。,6,三、金融数据的主

2、要类型、特点和来源,1.金融数据的主要类型 时间序列数据(Time series data) 是按照一定的时间间隔对某一变量在不同时间的取值进行观测得到的一组数据,例如每天的股票价格、每月的货币供应量、每季度的GDP、每年用于表示通货膨胀率的GDP平减指数等。,7,在分析时间序列数据时,应注意以下几点: (1)在利用时间序列数据回归模型时,各变量数据的频率应该是相同的; (2)不同时间的样本点之间的可比性问题; (3)使用时间序列数据回归模型时,往往会导致模型随机误差项产生序列相关; (4)使用时间序列数据回归模型时应特别注意数据序列的平稳性问题。,8,横截面数据(Cross-sectiona

3、l data) 是指对变量在某一时点上收集的数据的集合,例如,某一时间点上海证券交易所所有股票的收益率,2004年世界上发展中国家的外汇储备等。 平行数据(Panel data) 是指多个个体同样变量的时间序列数据按照一定顺序排列得到的集合,例如30家蓝筹股过去3年每日的收盘价。,9,2.金融数据的特点 与一般宏观经济数据相比,金融数据在频率、准确性、周期性等方面具有自己特有的性质: (1)金融数据可以更频繁地观察到,可用于计量分析的数据观测值个数可以成千上万,数量十分巨大; (2)金融数据一般都能在交易时准确记录下来; (3)金融数据一般也是不平稳的,但难以区分金融数据序列的随机游走、趋势以

4、及其他的一些特征。,10,3.金融数据的主要来源 政府部门和国际组织的出版物及网站 专业信息数据公司, 抽样调查,11,第二节 金融计量学软件简介,一、金融计量学主要软件简介 1.金融计量分析的主要任务 从反映金融问题的大量数据中提取和归纳金融问题的客观规律性,进行解释和预测,为金融政策和金融实践提供依据。 为此,必须合理、科学地组织管理大量的数据信息,并用计量经济学或金融计量学的方法对这些数据进行一系列复杂的数值计算处理。,12,2.分类(按操作的互动性与否分为) 菜单模式,如Microfit 命令行模式,如Eviews 及介于二者之间的中间模式,13,3.主要计量经济学软件 Eviews软

5、件 GAUSS软件 LIMDEP软件 Mathematica软件 Matlab软件 Microfit软件 Minitab软件,RATS软件 SAS软件 SHAZMA软件 S-PLUS软件 SPSS软件 STATA软件 TSP软件,14,二、本课程所用软件Microfit4.0和Eviews3.1 1.Microfit4.0使用简介 以Microfit4.0版本为例。 1 .数据输入、修改及保存,15,图1-2 Microfit 4.0主界面,16,图1-3 数据录入设定界面,17,图1-4 变量定义、修改窗口,18,图1-5 数据录入界面,19,2.命令窗口及绘图,图1-6 Microfit

6、命令窗口,20,图1-7 19621972年辞职率和失业率线性图,21,图1-8 19621972年辞职率和失业率散点图,22,3.一个回归分析案例,图1-9 Microfit 单方程回归分析窗口,23,图1-10 最小二乘估计结果及相关统计量,24,图1-11 四种假设检验的结果,25,(二)Eviews 3.1使用简介,1.数据输入、修改及保存 图1-12 Eviews新工作文件数据设定窗口,26,图1-13 空白新工作文件,27,(二)Eviews3.1使用简介,1.数据输入、修改及保存 图1-14 新工作文件数据导入窗口,28,图1-15 数据导入后工作文件,29,图1-16 察看数据

7、窗口,30,图1-17 GDP和M1线性图,31,图1-18 方程设定窗口,32,图1-19 回归结果,33,本章小节,金融计量学是金融学的一个重要分支,金融问题的数量化研究是金融计量学的目的,包括金融模型的设计、建立、估计、检验及使用模型进行预测和政策策划的系列过程。金融理论的迅速发展、金融模型的不断推出、计算机技术的日益发展和计量软件的多样化都为现代金融的数量化研究提供了有力的工具,这些条件的结合形成了金融计量分析的基础。,34,本章简要阐述了金融计量学的方法和一般应用步骤,着重介绍了金融数据的类型和特点,简要评述了主要的计量和统计软件包,对常用的Microfit和Eviews计量软件的使

8、用方法进行了详细讲解并举例说明。本章旨在使学生理解金融计量模型思想,了解金融数据的特点与来源,掌握常用的金融计量软件。,35,第二章 最小二乘法(OLS) 和线性回归模型,36,本章要点,最小二乘法的基本原理和计算方法 经典线性回归模型的基本假定 BLUE统计量的性质 t检验和置信区间检验的原理及步骤 多变量模型的回归系数的F检验 预测的类型及评判预测的标准 好模型具有的特征,37,第一节 最小二乘法的基本属性,一、有关回归的基本介绍 金融、经济变量之间的关系,大体上可以分为两种: (1)函数关系:Y=f(X1,X2,.,XP),其中Y的值是由Xi(i=1,2.p)所唯一确定的。 (2)相关关

9、系: Y=f(X1,X2,.,XP) ,这里Y的值不能由Xi(i=1,2.p)精确的唯一确定。,38,图2-1 货币供应量和GDP散点图,39,图2-1表示的是我国货币供应量M2(y)与经过季节调整的GDP(x)之间的关系(数据为1995年第一季度到2004年第二季度的季度数据)。,40,但有时候我们想知道当x变化一单位时,y平均变化多少,可以看到,由于图中所有的点都相对的集中在图中直线周围,因此我们可以以这条直线大致代表x与y之间的关系。如果我们能够确定这条直线,我们就可以用直线的斜率来表示当x变化一单位时y的变化程度,由图中的点确定线的过程就是回归。,41,对于变量间的相关关系,我们可以根

10、据大量的统计资料,找出它们在数量变化方面的规律(即“平均”的规律),这种统计规律所揭示的关系就是回归关系(regressive relationship),所表示的数学方程就是回归方程(regression equation)或回归模型(regression model)。,42,图2-1中的直线可表示为 (2.1),根据上式,在确定、的情况下,给定一个x值,我们就能够得到一个确定的y值,然而根据式(2.1)得到的y值与实际的y值存在一个误差(即图2-1中点到直线的距离)。,43,如果我们以表示误差,则方程(2.1)变为:,即:,其中t(=1,2,3,T)表示观测数。,(2.2),(2.3),

11、式(2.3)即为一个简单的双变量回归模型(因其仅具有两个变量x, y)的基本形式。,44,其中yt被称作因变量 (dependent variable)、 被解释变量 (explained variable)、 结果变量 (effect variable);,xt被称作自变量 (independent variable)、解释变量 (explanatory variable)、 原因变量 (causal variable),45,、为参数(parameters),或称回归系数(regression coefficients); t通常被称为随机误差项(stochastic error term

12、),或随机扰动项(random disturbance term),简称误差项, 在回归模型中它是不确定的,服从随机分布(相应的,yt也是不确定的,服从随机分布)。,46,为什么将t 包含在模型中? (1)有些变量是观测不到的或者是无法度量的,又或者影响因变量yt的因素太多; (2)在yt的度量过程中会发生偏误,这些偏误在模型中是表示不出来的; (3)外界随机因素对yt的影响也很难模型化,比如:恐怖事件、自然灾害、设备故障等。,47,二、参数的最小二乘估计 (一) 方法介绍 本章所介绍的是普通最小二乘法(ordinary least squares,简记OLS); 最小二乘法的基本原则是:最优

13、拟合直线应该使各点到直线的距离的和最小,也可表述为距离的平方和最小。 假定根据这一原理得到的、估计值为 、 ,则直线可表示为 。,48,直线上的yt值,记为 ,称为拟合值(fitted value),实际值与拟合值的差,记为 ,称为残差(residual) ,可以看作是随机误差项 的估计值。 根据OLS的基本原则,使直线与各散点的距离的平方和最小,实际上是使残差平方和(residual sum of squares, 简记RSS) 最小,即最小化:,RSS= = (2.4),49,根据最小化的一阶条件,将式2.4分别对、求偏导,并令其为零,即可求得结果如下 :,(2.5),(2.6),50,(

14、二)一些基本概念 1.总体(the population)和样本(the sample) 总体是指待研究变量的所有数据集合,可以是有限的,也可以是无限的;而样本是总体的一个子集。 2、总体回归方程(the population regression function,简记PRF),样本回归方程(the sample regression function,简记SRF)。,51,总体回归方程(PRF)表示变量之间的真实关系,有时也被称为数据生成过程(DGP),PRF中的、值是真实值,方程为:,+,(2. 7),样本回归方程(SRF)是根据所选样本估算的变量之间的关系函数,方程为:,注意:SRF中

15、没有误差项,根据这一方程得到的是总体因变量的期望值,(2.8),52,于是方程(2.7)可以写为: (2.9) 总体y值被分解为两部分:模型拟合值( )和残差项( )。,53,3.线性关系 对线性的第一种解释是指:y是x的线性函数,比如,y= 。 对线性的第二种解释是指:y是参数的一个线性函数,它可以不是变量x的线性函数。 比如,y= 就是一个线性回归模型, 但 则不是。 在本课程中,线性回归一词总是对指参数为线性的一种回归(即参数只以一次方出现),对解释变量x则可以是或不是线性的。,54,有些模型看起来不是线性回归,但经过一些基本代数变换可以转换成线性回归模型。例如,,(2.10),可以进行

16、如下变换:,(2.11),令 、 、 ,则方程 (2. 11)变为:,(2.12),可以看到,模型2.12即为一线性模型。,55,4.估计量(estimator)和估计值(estimate) 估计量是指计算系数的方程;而估计值是指估计出来的系数的数值。,56,三、最小二乘估计量的性质和分布 (一) 经典线性回归模型的基本假设 (1) ,即残差具有零均值; (2)var ,即残差具有常数方差,且对于所有x值是有限的; (3)cov ,即残差项之间在统计意义上是相互独立的; (4)cov ,即残差项与变量x无关; (5)tN ,即残差项服从正态分布,57,(二)最小二乘估计量的性质 如果满足假设(

17、1)(4),由最小二乘法得到的估计量 、 具有一些特性,它们是最优线性无偏估计量(Best Linear Unbiased Estimators,简记BLUE)。,58,估计量(estimator):意味着 、 是包含着真实、值的估计量; 线性(linear):意味着 、 与随机变量y之间是线性函数关系; 无偏(unbiased):意味着平均而言,实际得到的 、 值与其真实值是一致的; 最优(best):意味着在所有线性无偏估计量里,OLS估计量 具有最小方差。,59,(三) OLS估计量的方差、标准差和其概率分布 1.OLS估计量的方差、标准差。 给定假设(1)(4),估计量的标准差计算方程

18、如下 :,其中, 是残差的估计标准差。,(2.21),(2.22),60,参数估计量的标准差具有如下的性质: (1)样本容量T越大,参数估计值的标准差越小; (2) 和 都取决于s2。 s2是残差的方差估计量。 s2越大,残差的分布就越分散,这样模型的不确定性也就越大。如果s2很大,这意味着估计直线不能很好地拟合散点;,61,(3)参数估计值的方差与 成反比。 其值越小,散点越集中,这样就越难准确地估计拟合直线;相反,如果 越大,散点越分散,这样就可以容易地估计出拟合直线,并且可信度也大得多。 比较图22就可以清楚地看到这点。,62,图22 直线拟合和散点集中度的关系,63,(4) 项只影响截

19、距的标准差,不影响斜率的标准差。理由是: 衡量的是散点与y轴的距离。 越大,散点离y轴越远,就越难准确地估计出拟合直线与y轴的交点(即截距);反之,则相反。,64,2OLS估计量的概率分布 给定假设条件(5),即 ,则 也服从正态分布 系数估计量也是服从正态分布的:,(2.30),(2.31),65,需要注意的是:如果残差不服从正态分布,即假设(5)不成立,但只要CLRM的其他假设条件还成立,且样本容量足够大,则通常认为系数估计量还是服从正态分布的。,其标准正态分布为:,(2.32),(2.33),66,但是,总体回归方程中的系数的真实标准差是得不到的,只能得到样本的系数标准差( 、 )。用样

20、本的标准差去替代总体标准差会产生不确定性,并且,、 将不再服从正态分布,而服从自由度为T-2的t分布,其中T为样本容量,即:, (2.34),(2.35),67,3.正态分布和t分布的关系,图2-3 正态分布和t分布形状比较,68,从图形上来看,t分布的尾比较厚,均值处的最大值小于正态分布。 随着t分布自由度的增大,其对应临界值显著减小,当自由度趋向于无穷时,t分布就服从标准正态分布了。 所以正态分布可以看作是t分布的一个特例。,69,第二节 一元线性回归模型的统计检验,一、拟合优度(goodness of fit statistics)检验 拟合优度可用R2 表示:模型所要解释的 是y相对于

21、其均值的波动性,即 (总平方和,the total sum of squares, 简记TSS),这一平方和可以分成两部分:,70,= + (2.36),是被模型所解释的部分,称为回归平方和(the explained sum of squares,简记ESS); 是不能被模型所解释的残差平方和(RSS),即 =,71,TSS、ESS、RSS的关系以下图来表示更加直观一些:,图24 TSS、ESS、RSS的关系,72,拟合优度 因为 TSS=ESS+RSS 所以 R2 (2.39),(2.37),(2.38),R2越大,说明回归线拟合程度越好;R2越小,说明回归线拟合程度越差。由上可知,通过考

22、察R2的大小,我们就能粗略地看出回归线的优劣。,73,但是,R2作为拟合优度的一个衡量标准也存在一些问题: (1)如果模型被重新组合,被解释变量发生了变化,那么R2也将随之改变,因此具有不同被解释变量的模型之间是无法来比较R2的大小的。,74,(2)增加了一个解释变量以后, R2只会增大而不会减小,除非增加的那个解释变量之前的系数为零,但在通常情况下该系数是不为零的,因此只要增加解释变量, R2就会不断的增大,这样我们就无法判断出这些解释变量是否应该包含在模型中。 (3)R2的值经常会很高,达到0.9或更高,所以我们无法判断模型之间到底孰优孰劣。,75,为了解决上面第二个问题,我们通常用调整过

23、的R2来代替未调整过的R2 。对R2进行调整主要是考虑到在引进一个解释变量时,会失去相应的自由度。调整过的R2用 来表示,公式为: 其中T为样本容量 ,K为自变量个数,(2.40),76,二、假设检验 假设检验的基本任务是根据样本所提供的信息,对未知总体分布某些方面的假设做出合理解释 假设检验的程序是,先根据实际问题的要求提出一个论断,称为零假设(null hypothesis)或原假设,记为H0(一般并列的有一个备择假设(alternative hypothesis),记为H1 ) 然后根据样本的有关信息,对H0的真伪进行判断,做出拒绝H0或不能拒绝H0的决策。,77,假设检验的基本思想是概

24、率性质的反证法。 概率性质的反证法的根据是小概率事件原理。该原理认为“小概率事件在一次实验中几乎是不可能发生的”。在原假设H0下构造一个事件(即检验统计量),这个事件在“原假设H0是正确的”的条件下是一个小概率事件,如果该事件发生了,说明“原假设H0是正确的”是错误的,因为不应该出现的小概率事件出现了,应该拒绝原假设H0 。,78,假设检验有两种方法: 置信区间检验法(confidence interval approach)和显著性检验法(test of significance approach)。 显著性检验法中最常用的是t检验和F检验,前者是对单个变量系数的显著性检验,后者是对多个变量

25、系数的联合显著性检验。,79,(一)t检验 下面我们具体介绍对方程(2.3)的系数进行t检验的主要步骤。 (1)用OLS方法回归方程(2.3),得到的估计值 及其标准差 。 (2)假定我们建立的零假设是: ,备则假设是 (这是一个双侧检验)。,80,则我们建立的统计量 服从自由度为T-2的t分布。,(3)选择一个显著性水平(通常是5%),我们就可以在t分布中确定拒绝区域和非拒绝区域,如图2-5。如果选择显著性水平为5%,则表明有5%的分布将落在拒绝区域,81,图2-5 双侧检验拒绝区域和非拒绝区域分布,82,(4)选定显著性水平后,我们就可以根据t分布表求得自由度为T-2的临界值,当检验统计值

26、的绝对值大于临界值时,它就落在拒绝区域,因此我们拒绝的原假设,而接受备则假设。反之则相反。 可以看到,t检验的基本原理是如果参数的假设值与估计值差别很大,就会导致小概率事件的发生,从而导致我们拒绝参数的假设值。,83,(二)置信区间法 仍以方程2.3的系数为例,置信区间法的基本思想是建立围绕估计值 的一定的限制范围,推断总体参数是否在一定的置信度下落在此区间范围内。,置信区间检验的主要步骤(所建立的零假设同 t检验)。,84,(1)用OLS法回归方程(2.3),得到的估计值 及其标准差 。 (2)选择一个显著性水平(通常为5%),这相当于选择95%的置信度。查t分布表,获得自由度为T-2的临界

27、值 。 (3)所建立的置信区间为( , ) (2.41),85,(4)如果零假设值 落在置信区间外,我们就拒绝 的原假设;反之,则不能拒绝。 需要注意的是,置信区间检验都是双侧检验,尽管在理论上建立单侧检验也是可行的。,86,(三)t检验与置信区间检验的关系,在显著性检验法下,当 的绝对值小于临界值时,即: (2.42) 时,我们不能拒绝原假设。 对式(2.41)变形,我们可以得到: (2.43) 可以看到,式(2.43)恰好是置信区间法的置信区间式(2.41),因此,实际上t检验法与置信区间法提供的结果是完全一样的。,87,(四)第一类错误和第二类错误,如果有一个零假设在5的显著性水平下被拒

28、绝了,有可能这个拒绝是不正确的,这种错误被称为第一类错误,它发生的概率为5。 另外一种情况是,我们得到95的一个置信区间,落在这个区间的零假设我们都不能拒绝,当我们接受一个零假设的时候也可能犯错误,因为回归系数的真实值可能是该区间内的另外一个值,这一错误被称为第二类错误。 在选择显著性水平时人们面临抉择:降低犯第一类错误的概率就会增加犯第二类错误的概率。,88,(五)P值 P值是计量经济结果对应的精确的显著性水平。 P值度量的是犯第一类错误的概率,即拒绝正确的零假设的概率。P值越大,错误地拒绝零假设的可能性就越大;p值越小,拒绝零假设时就越放心。现在许多统计软件都能计算各种统计量的p值,如Ev

29、iews、Stata等。,89,第三节 多变量线性回归模型的统计检验,一、多变量模型的简单介绍 考察下面这个方程: t=1,2,3.T (2.44) 对y产生影响的解释变量共有k-1(x2t,x3t,xkt)个,系数(12k)分别衡量了解释变量对因变量y的边际影响的程度。,90,方程(2.44)的矩阵形式为 这里:y是T1矩阵,X是Tk矩阵,是k1矩阵,u是T1矩阵,(2.46),91,在多变量回归中残差向量为:,(2.47),残差平方和为:,(2.48),92,可以得到多变量回归系数的估计表达式,(2.49),同样我们可以得到多变量回归模型残差的样本方差,(2.50),参数的协方差矩阵 (2

30、.51),93,二、拟合优度检验 在多变量模型中,我们想知道解释变量一起对因变量y变动的解释程度。我们将度量这个信息的量称为多元判定系数R2。 在多变量模型中,下面这个等式也成立: TSS=ESS+RSS (2.52) 其中,TSS为总离差平方和;ESS为回归平方和;RSS为残差平方和。,94,与双变量模型类似,定义如下: 即,R2是回归平方和与总离差平方和的比值;与双变量模型唯一不同的是,ESS值与多个解释变量有关。 R2的值在0与1之间,越接近于1,说明估计的回归直线拟合得越好。,(2.53),95,可以证明: (2.54) 因此, (2.55),96,三、假设检验 (一)、t检验 在多元

31、回归模型中,t统计量为:,(2.56),均服从自由度为(n-k)的t分布。下面的检验过程跟双变量线性回归模型的检验过程一样。,97,(二)、F检验 F检验的第一个用途是对所有的回归系数全为0的零假设的检验。第二个用途是用来检验有关部分回归系数的联合检验,就方法而言,两种用途是完全没有差别的,下面我们将以第二个用途为例,对F检验进行介绍。,98,为了解联合检验是如何进行的,考虑如下多元回归模型:,(2.57),这个模型称为无约束回归模型(unrestricted regression),因为关于回归系数没有任何限制。,99,假设我们想检验其中q个回归系数是否同时为零,为此改写公式(2.57),将

32、所有变量分为两组,第一组包含k-q个变量(包括常项),第二组包含q个变量:,(2.58),100,如果假定所有后q个系数都为零,即建立零假设: ,则修正的模型将变为有约束回归模型(restricted regression)(零系数条件):,(2.59),101,关于上述零假设的检验很简单。若从模型中去掉这q个变量,对有约束回归方程(2.59)进行估计的话,得到的误差平方和 肯定会比相应的无约束回归方程的误差平方和 大。如果零假设正确,去掉这q个变量对方程的解释能力影响不大。当然,零假设的检验依赖于限制条件的数目,即被设定为零的系数个数,以及无约束回归模型的自由度。,102,检验的统计量为:,

33、(2.60),在这里,分子是误差平方和的增加与零假设所隐含的参数限制条件的个数之比;分母是模型的误差平方和与无条件模型的自由度之比。如果零假设为真,式(2.60)中的统计量将服从分子自由度为q,分母自由度为N-K的F分布。,103,对回归系数的子集的F检验与对整个回归方程的F检验做法一样。选定显著性水平,比如1或5,然后将检验统计量的值与F分布的临界值进行比较。如果统计量的值大于临界值,我们拒绝零假设,认为这组变量在统计上是显著的。一般的原则是,必须对两个方程分别进行估计,以便正确地运用这种F检验。,104,F检验与R2有密切的联系。回想 ,则 , (2.61) 两个统计量具有相同的因变量,因

34、此 将上面的两个方程代入(2.60),检验的统计量可以写成:,(2.62),105,第四节 预测,一、预测的概念和类型 (一)预测的概念 金融计量学中,所谓预测就是根据金融经济变量的过去和现在的发展规律,借助计量模型对其未来的发展趋势和状况进行描述、分析,形成科学的假设和判断。,106,(二)预测原理 条件期望(conditional expectations),在t期Y的t+1期的条件期望值记作 ,它表示的是在所有已知的t期的信息的条件下,Y在t+1期的期望值。 假定在t期,我们要对因变量Y的下一期(即t+1期)值进行预测,则记作 。,107,在t期对Y的下一期的所有预测值中,Y的条件期望值

35、是最优的(即具有最小方差),因此,我们有:,(2.65),108,(三)预测的类型: (1)无条件预测和有条件预测 所谓无条件预测,是指预测模型中所有的解释变量的值都是已知的,在此条件下所进行的预测。 所谓有条件预测,是指预测模型中某些解释变量的值是未知的,因此想要对被解释变量进行预测,必须首先预测解释变量的值。,109,(2)样本内(in-sample)预测和样本外(out-of-sample)预测 所谓样本内预测是指用全部观测值来估计模型,然后用估计得到的模型对其中的一部分观测值进行预测。 样本外预测是指将全部观测值分为两部分,一部分用来估计模型,然后用估计得到的模型对另一部分数据进行预测

36、。,110,(3)事前预测和事后模拟 顾名思义,事后模拟就是我们已经获得要预测的值的实际值,进行预测是为了评价预测模型的好坏。 事前预测是我们在不知道因变量真实值的情况下对其的预测。,111,(4)一步向前(one-step-ahead)预测和多步向前(multi-step-ahead)预测 所谓一步向前预测,是指仅对下一期的变量值进行预测,例如在t期对t+1期的值进行预测,在t+1期对t+2期的值进行的预测等。 多步向前预测则不仅是对下一期的值进行预测,也对更下期值进行预测,例如在t期对t+1期、t+2期、t+r期的值进行预测。,112,二、预测的评价标准 、平均预测误差平方和(mean s

37、quared error,简记MSE)平均预测误差绝对值(mean absolute error,简记MAE)。 变量的MSE定义为: MSE= (2.66) 其中 的预测值, 实际值,T时段数,113,变量的MAE定义如下: MAE= ,变量的定义同前 (2.67) 可以看到,MSE和MAE度量的是误差的绝对大小,只能通过与该变量平均值的比较来判断误差的大小,误差越大,说明模型的预测效果越不理想。,114,2、Theil不相等系数 其定义为: (2.68) 注意,U的分子就是MSE的平方根,而分母使得U总在0与1之间。如果U=0,则对所有的t, 完全拟合;如果U=1,则模型的预测能力最差。因

38、此,Theil不等系数度量的是误差的相对大小。,115,Theil不等系数可以分解成如下有用的形式: 其中 分别是序列 和 的平均值和标准差, 是它们的相关系数,即:,(2.69),116,定义不相等比例如下:,(2.70),(2.71),(2.72),117,偏误比例 表示系统误差,因为它度量的是模拟序列与实际序列之间的偏离程度。 方差比例 表示的是模型中的变量重复其实际变化程度的能力。 协方差比例 度量的是非系统误差,即反映的是考虑了与平均值的离差之后剩下的误差。 理想的不相等比例的分布是 。,比例 分别称为U的偏误比例,方差比例,协方差比例。它们是将模型误差按特征来源分解的有效方法( )

39、。,118,第五节:模型选择,一、“好”模型具有的特性 1、节省性(parsimony) 一个好的模型应在相对精确反应现实的基础上尽可能的简单。 2、可识别性(identifiability) 对于给定的一组数据,估计的参数要有唯一确定值。,119,3、高拟合性(goodness of fit) 回归分析的基本思想是用模型中包含的变量来解释被解释变量的变化,因此解释能力的高低就成为衡量模型好坏的重要的标准。 4、理论一致性(theoretical consistency) 即使模型的拟合性很高,但是如果模型中某一变量系数的估计值符号与经济理论不符,那么这个模型就是失败的。,120,5、预测能力

40、(predictive power) 著名经济学家弗里德曼(M.Friedman)认为:“对假设(模型)的真实性唯一有效的检验就是将预测值与经验值相比较”。因此一个好的模型必须有对未来的较强的预测能力。,121,二、用于预测的模型的选择 因为R2将随着模型解释变量的增多而不断增加,按照此标准我们将不会得到最佳的预测模型。 因此必须对由于解释变量增多而造成自由度丢失施加一个惩罚项,其中的一个标准就是:,122,对自由度丢失惩罚更为严格的标准: Akaike的信息准则(Akaike information criterion,简记为AIC)和Schwarz的信息准则(Schwarz informa

41、tion criterion,简记为SC),123,其中 是方程随机误差项方差的估计值,k是解释变量的个数,T是样本容量。 可以看到,AIC和SC 的惩罚项 、 比 更为严厉,而且相对来说SC标准对自由度的惩罚比AIC更为严厉。无论是AIC标准还是SC标准,从预测的角度来看,度量值越低,模型的预测会更好。,124,本章小节,本章内容在计量经济学中是最基础也是最重要的部分。在这一章中,我们首先介绍了最小二乘法及其估计量的性质和分布。在此基础上我们对一元线性回归模型的统计检验进行了详细讨论,接着将模型扩展,讨论了多元线性回归模型。在用模型进行预测时,主要有两种情况:即有条件预测和无条件预测。最后一

42、小节我们简单介绍了模型的选择。,125,第三章 异方差和自相关,126,本章要点,异方差的定义、产生原因及后果 异方差的检验方法 异方差的修正方法 自相关的产生原因 忽略自相关的严重后果 自相关的检验 自相关的修正,127,在前面的章节里我们已经完成了对经典正态线性回归模型的讨论。但在实际中,经典线性回归模型的基本假定经常是不能得到满足的,而若在此状况下仍应用OLS进行回归,就会产生一系列的问题,因此我们就需要采取不同的方法对基本假定不满足的情况予以处理。 在本章中,我们将着重考虑假定2和假定3得不到满足,即存在异方差和自相关情况下的处理办法。,128,第一节 异方差的介绍,一、异方差的定义及

43、产生原因 异方差(heteroscedasticy)就是对同方差假设(assumption of homoscedasticity)的违反。经典回归中同方差是指随着样本观察点X的变化,线性模型中随机误差项 的方差并不改变,保持为常数,即 i=1,2,n (3.1) 如果的数值对不同的样本观察值各不相同,则称随机误差项具有异方差,即 常数 i=1,2,n (3.2),129,图3-1 异方差直观图,130,为什么会产生这种异方差性呢? 一方面是因为随机误差项包括了测量误差和模型中被省略的一些因素对因变量的影响,另一方面来自不同抽样单元的因变量观察值之间可能差别很大。因此,异方差性多出现在横截面样

44、本之中。至于时间序列,则由于因变量观察值来自不同时期的同一样本单元,通常因变量的不同观察值之间的差别不是很大,所以异方差性一般不明显。,131,二、异方差的后果,一旦随机误差项违反同方差假设,即具有异方差性,如果仍然用OLS进行参数估计,将会产生什么样的后果呢? 结论就是,OLS估计量的线性和无偏性都不会受到影响,但不再具备最优性,即在所有线性无偏估计值中我们得出的估计值的方差并非是最小的。 所以,当回归模型中随机项具有异方差性时,OLS法已不再适用。,132,第二节 异方差的检验,由于异方差的存在会导致OLS估计量的最佳性丧失,降低精确度。所以,对所取得的样本数据(尤其是横截面数据)判断是否

45、存在异方差,是我们在进行正确回归分析之前要考虑的事情。异方差的检验主要有图示法和解析法,下面我们将介绍几种常用的检验方法。,133,一、图示法,图示法是检验异方差的一种直观方法,通常有下列两种思路: (一)因变量y与解释变量x的散点图:若随着x的增加,图中散点分布的区域逐渐变宽或变窄,或出现了偏离带状区域的复杂变化,则随机项可能出现了异方差。 (二)残差图。残差图即残差平方 ( 的估计值)与x的散点图,或者在有多个解释变量时可作残差 与y的散点图或残差 和可能与异方差有关的x的散点图。具体做法:先在同方差的假设下对原模型应用OLS法,求出和残差平方 ,再绘制残差图( , )。,134,二、解析

46、法,检验异方差的解析方法的共同思想是,由于不同的观察值随机误差项具有不同的方差,因此检验异方差的主要问题是判断随机误差项的方差与解释变量之间的相关性,下列这些方法都是围绕这个思路,通过建立不同的模型和验判标准来检验异方差。,135,(一)Goldfeld-Quandt检验法,Goldfeld-Quandt检验法是由S.M.Goldfeld和R.E.Quandt于1965年提出的。这种检验方法以F检验为基础,适用于大样本情形(n30),并且要求满足条件:观测值的数目至少是参数的二倍;随机项没有自相关并且服从正态分布。 统计假设:零假设 : 是同方差(i=1,2,n) 备择假设 : 具有异方差,1

47、36,Goldfeld-Quandt检验法涉及对两个最小二乘回归直线的计算,一个回归直线采用我们认为随机项方差较小的数据,另一个采用我们认为随机项方差较大的数据。如果各回归直线残差的方差大致相等,则不能拒绝同方差的原假设,但是如果残差的方差增加很多,就可能拒绝原假设。步骤为:,137,第一步,处理观测值。 将某个解释变量的观测值按由小到大的顺序排列,然后将居中的d项观测数据除去,其中d的大小可以选择,比如取样本容量的1/4。再将剩余的(n-d)个数据分为数目相等的二组。,138,第二步,建立回归方程求残差平方和。 拟合两个回归模型,第一个是关于较小x值的那部分数据,第二个是关于较大x值的那部分数据。每一个回归模型都有(n-d)/2个数据以及(n-d)/2-2的自由度。d必须足够小以保证有足够的自由度,从而能够对每一个回归模型进行适当的估计。 对每一个回归模型,计算残差

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1