虚拟变量回归.ppt

上传人:本田雅阁 文档编号:2668297 上传时间:2019-05-03 格式:PPT 页数:65 大小:1.32MB
返回 下载 相关 举报
虚拟变量回归.ppt_第1页
第1页 / 共65页
虚拟变量回归.ppt_第2页
第2页 / 共65页
虚拟变量回归.ppt_第3页
第3页 / 共65页
亲,该文档总共65页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《虚拟变量回归.ppt》由会员分享,可在线阅读,更多相关《虚拟变量回归.ppt(65页珍藏版)》请在三一文库上搜索。

1、第八章 虚拟变量回归 计量经济学 1 在对在校学生的消费行为进行的调查中,发现在校 生的消费行为呈现多元化的结构。人际交往消费、 手机类消费、衣着类消费、化妆品类消费、电脑类 消费、旅游类消费占有较大的比例;而食品类消费 、学习用品类消费不突显。 显然,男女生在消费上存在差异。为了了解男、女 生的消费支出结构差异,应当如何建立模型? 面临的问题:如何把男女生这样的非数量变量引 入方程? 引子:男女大学生消费真有差异吗? 2 问题的一般性描述 在实际建模中,一些定性变量具有不可忽视的重要 影响。例如,研究某个企业的销售水平,产业属性 (制造业、零售业)、所有制(私营、非私营)、 地理位置(东、中

2、、西部)、管理者的素质、不同 的收入水平等是值得考虑的重要影响因素,但这些 因素共同的特征是定性描述的。 如何对非定量因素进行回归分析? 采用“虚拟变量”对定性变量进行量化一种思路。 3 第八章 虚拟变量回归 本章主要讨论: 虚拟变量 虚拟解释变量的回归 虚拟被解释变量的回归(选讲,不包括) 4 第一节 虚拟变量 本节基本内容: 基本概念 虚拟变量设置规则 5 一、基本概念 定量因素:可直接测度、数值性的因素。 定性因素:属性因素,表征某种属性存在与否的 非数值性的因素。 基本思想: 直接在回归模型中加入定性因素存在诸多的困难 (那些困难?),是否可将这些定性因素进行量 化,以达到定性因素能与

3、定量因素有着相同作用 之目的。 6 计量经济学中,将取值为0和1的人工变量称为虚 拟变量。虚拟变量也称:哑元变量、定性变量等 等。通常用字母D或DUM加以表示(英文中虚拟 或者哑元Dummy的缩写)。 对定性变量的量化可采用虚拟变量的方式实现。 虚拟变量的定义 7 虚拟变量的设置规则涉及三个方面: 1.“0”和“1”选取原则 2.属性(状态、水平)因素与设置虚拟变量 数量的关系 3.虚拟变量在回归分析中的角色以及作用等 方面的问题 二、虚拟变量设置规则 8 “0”和“1”选取原 则 l 虚拟变量取“1”或“0”的原则,应从分析问 题的目的出发予以界定。 l 从理论上讲,虚拟变量取“0”值通常代

4、表比较 的基础类型;而虚拟变量取“1”值通常代表被 比较的类型。 “0”代表基期(比较的基础,参照物); “1”代表报告期(被比较的效应)。 9 例如,比较收入时考察性别的作用。当研究男性收入是否 高于女性时,是将女性作为比较的基础(参照物),故有 男性为“1”,女性为“0”。 例1 问题: 为何只选0、1,选2、3、4行吗?为什么? 10 定性因素的属性既可能为两种状态,也可能为多种 状态。例如,性别(男、女两种)、季节(4种状 态),地理位置(东、中、西部),行业归属,所 有制,收入的分组等。 属性的状态(水平)数与虚拟变量 数量的关系 11 1.若定性因素具有 个 相互排斥属性(或 几个

5、水平),当回归模型有截距项时,只能引入 个虚拟变量; 2.当回归模型无截距项时,则可引入 个虚拟变 量;否则,就会陷入“虚拟变量陷阱”。(为什 么?) 虚拟变量数量的设置规则 12 研究居民住房消费支出 和居民可支配收入 之间的 数量关系。回归模型的设定为: 现在要考虑城镇居民和农村居民之间的差异,如何办? 为了对 “城镇居民”、“农村居民”进行区分,分析 各自在住房消费支出 上的差异,设 为城镇; 为农村,则模型为 (模型有截距,“居民属性”定性变量只有两个相互排斥 的属性状态( ),故只设定一个虚拟变量。) 一个例子(虚拟变量陷阱) 13 若对两个相互排斥的属性 “居民属性” ,仍然 引入

6、 个虚拟变量,则有 则模型(1)为 则对任一家庭都有: , 即产生完全共线,陷入了“虚拟变量陷阱”。 “虚拟变量陷阱”的实质是:完全多重共线性。 14 虚拟变量既可作为被解释变量,也可作为解释 变量,分别称其为虚拟被解释变量和虚拟解释变量。 虚拟被解释变量的研究是当前计量经济学研究的 前沿领域,如MacFadden、Heckmen等人的微观计 量经济学研究,大量涉及到虚拟被解释变量的分析。 本课程只是讨论虚拟解释变量的问题 虚拟变量在回归模型中的角色 15 第二节 虚拟解释变量的回归 本节基本内容: 加法类型 乘法类型 虚拟解释变量综合应用 16 在计量经济学中,通常引入虚拟变量的方式分为 加

7、法方式和乘法方式两种:即 实质:加法方式引入虚拟变量改变的是截距; 乘法方式引入虚拟变量改变的是斜率。 17 以加法方式引入虚拟变拟变 量时时,主要考虑虑的问问 题题是定性因素的属性和引入虚拟变拟变 量的个数。 分为为四种情形讨论讨论 : (1)解释变释变 量只有一个定性变变量而无定量变变量, 而且定性变变量为为两种相互排斥的属性; (2)解释变释变 量分别为别为 一个定性变变量(两种属性) 和一个定量解释变释变 量; 一、加法类型 18 (3)解释变释变 量分别为别为 一个定性变变量(两种以上属 性)和一个定量解释变释变 量; (4)解释变释变 量分别为别为 两个定性变变量(各自分别别是 两

8、种属性)和一个定量解释变释变 量; 思考: 四种加法方式引入虚拟变拟变 量会产产生什么效应应? 19 (1)一个两种属性定性解释变 量而无定量变量的情形 农村 20 (2) 一个定性解释变量(两种 属性)和一个定量解释变量的 情形 城市 农村 21 共同的特征:截距发生改变(?) 22 (3)一个定性解释变量(两种 以上属性)和一个定量解释变量 的情形 23 24 (4)两个定性解释变量(均为 两种属性)和一个定量解释变量 的情形 25 夏季、农村居民 冬季、农村居民 26 上述图形的前提条件是什么? 27 运用OLS得到回归结果,再用t检验讨论因素 是否对模型有影响。 加法方式引入虚拟变量的

9、一般表达式: 基本分析方法: 条件期望。 28 加法方式引入虚拟变量的主要作用为: 1.在有定量解释变量的情形下,主要改变方程 截距; 2.在没有定量解释变量的情形下,主要用于方 差分析。 29 基本思想 以乘法方式引入虚拟变拟变 量时时,是在所设设立的模型中,将虚 拟拟 解释变释变 量与其它解释变释变 量的乘积积,作为为新的解释变释变 量出现现 在 模型中,以达到其调调整设设定模型斜率系数的目的。或者将模 型斜率系数表示为为虚拟变拟变 量的函数,以达到相同的目的。 乘法引入方式: (1)截距不变变; (2)截距和斜率均发发生变变化; 分析手段:仍然是条件期望。 二、乘法类型 30 模型形式:

10、 例:研究消费支出 受收入 、年份状况 的影响 (1)截距不变的情形 31 (2)截距和斜率均发生变 化 例,同样研究消费支出 、收入 、年份状况 间的影 响关系。 模型形式: 32 不同截距、斜率的组合图形 重合回归:截距斜率均相同平行回归:截距不同斜率相同 共点回归:截距相同斜率不同 交叉(不同)回归:截距斜率均不同 33 三、虚拟解释变量综合应 用 所谓综合应用是指将引入虚拟解释变量的加法方 式、乘法方式进行综合使用。 基本分析方式仍然是条件期望分析。 本课主要讨论 (1)结构变化分析; (2)交互效应分析; (3)分段回归分析 34 (1)结构变化分析 结构变化的实质是检验所设定的模型

11、在样本期内 是否为同一模型。显然,平行回归、共点回归、 不同的回归三个模型均不是同一模型。 平行回归模型的假定是斜率保持不变(加法类型 ,包括方差分析); 共点回归模型的假定是截距保持不变(乘法类型 ,又被称为协方差分析); 不同的回归的模型的假定是截距、斜率均为变动 的(加法、乘法类型的组合)。 35 例:比较改革开放前、后我国居民(平均)“储 蓄收入”总量关系是否发生了变化? 模型的设定形式为 : 36 显然,只要 、 不同时为零,上述模型就能刻画 改革开放前后我国居民储蓄收入模型结构是否发生 变化。 回归方程: 37 问题: 1.本例中,平行、共点回归、不同的回归三模型的 经济学背景解释

12、是什么? 2.如何进行结构变化判断? 3.是否可对(2)、(3)分别进行 OLS 估计?为什么 ? 4.若分别对(2)、(3)进行 OLS 估计应注意什么? 38 (2)交互效应分析 交互作用: 一个解释变量的边际效应有时可能要依赖于另一 个解释变量。为此,Klein和Morgen(1951)提出了 有关收入和财产在决定消费模式上相互作用的假 设。他们认为消费的边际倾向不仅依赖于收入, 而且也依赖于财产的多少 较富有的人可能会 有不同的消费倾向。 39 为了捕获该影响,设 。假设边际 消费倾向 依赖于财产 。一个简单的表示方法 就是 。代入消费函数,有: 由于 捕获了收入和财产之间的相互作用而

13、被称 为交互作用项。 显然,刻画交互作用的方法,在变量为数量(定量 )变量时, 是以乘法方式引入虚拟变量的。 40 例: 是否发展油菜籽生产与是否发展养蜂生产的 差异对农副产品总收益的影响研究。 模型设定为: (1)式中, 以加法形式引入虚拟变量暗含何假设 ? 41 (1)式以加法形式引入,暗含的假设为: 菜籽生产和养蜂生产是分别独立地影响农副品生产 总收益。但是,在发展油菜籽生产时,同时也发展 养蜂生产,所取得的农副产品生产总收益,可能会 高于不发展养蜂生产的情况。即在是否发展油菜籽 生产与养蜂生产的虚拟变量 和 间,很可能 存在着一定的交互作用,且这种交互影响对被解释 变量农副产品生产收益

14、会有影响。 42 问题:如何刻画同时发展油菜籽生产和养蜂生产的 交互作用? 基本思想:在模型中引入相关的两个变量的乘积。 区别之处在于,上页定义中的交互效应是针对数量 变量,而现在是定性变量,又应当如何处理? 43 为了反映交互效应,将(1)变为: 同时发展油菜籽和 养蜂生产: 发展油菜籽生产: 发展养蜂生产: 基础类型: 44 如何检验交互效应是否存在? 若拒绝原假设,即交互效应对 产生了影响(应 该引入模型)。 45 作用: 提高模型的描述精度。 虚拟变量也可以用来代表数量因素的不同阶段。 分段线性回归就是类似情形中常见的一种。 一个例子: 研究不同时段我国居民的消费行为。 实际数据表明,

15、1979年以前,我国居民的消费支 出 呈缓慢上升的趋势;从1979年开始,居民消 费支出为快速上升趋势。 如何刻画我国居民在不同时段的消费行为? (3)分段回归分析 46 基本思路:采用乘法方式引入虚拟变量的手段。 显然,1979年是一个转折点,可考虑在这个转折 点作为虚拟变量设定的依据。若设 1979, 当 时可引入虚拟变量。(为什么选择1979 作为转折点?) 47 (t1955,1956,2004) 依据上述思路,有如下描述我国居民在不同时段 消费行为模型: 居民消费趋势方程: 48 1979年之前,回归模型的斜率为 ; 1979年之前,回归模型的斜率为 ; 若统计检验表明, 显著不为零

16、,则我国居民的消 费行为在1979年前后发生了明显改变。 分析 49 第三节 案例分析 为了考察改革开放以来中国居民的储蓄存款与收 入的关系是否已发生变化,以城乡居民人民币储 蓄存款年底余额代表居民储蓄( ),以国民总 收入GNI代表城乡居民收入,分析居民收入对储蓄 存款影响的数量关系,并建立相应的计量经济学 模型 。 50 表8.1 国民总收入与居民储蓄存款 单位:亿元 年 份 国民总总 收入 ( GNI) 城乡乡居民 人民币储币储 蓄存款年 底余额额( ) 城乡乡居民 人民币储币储 蓄存款增 加额额( ) 年 份 国民总总收 入 (GNI ) 城乡乡居民人 民币储币储 蓄 存款年底余 额额

17、 ( ) 城乡乡居民 人民币储币储 蓄存款增 额额 ( ) 19783624.1210.6NA199121662.5 9241.62121.8 19794038.228170.4199226651.911759.42517.8 19804517.8399.5118.5199334560.515203.53444.1 19814860.3532.7124.219944667021518.86315.3 19825301.8675.4151.7199557494.929662.38143.5 19835957.4892.5217.1199666850.538520.88858.5 数据来源:中国统

18、计年鉴2004,中国统计出版社。表中“城乡居民人民币储 蓄存款年增加额”为年鉴数值,与用年底余额计算的数值有差异。51 表8.1 国民总收入与居民储蓄存款 (续) 单位:亿元 年 份 国民总总收 入 (GNI ) 城乡乡居 民人民 币储币储 蓄 存款年 底余额额 ( ) 城乡乡居 民人民 币储币储 蓄 存款增 加额额( ) 年 份 国民总总收入 (GNI) 城乡乡居民人 民币储币储 蓄存 款年底余额额 ( ) 城乡乡居民人 民币储币储 蓄 存款增加额额 ( ) 19847206.71214.7322.2199773142.746279.87759 19858989.11622.6407.919

19、9876967.253407.57615.4 198610201.42237.6615199980579.459621.86253 198711954.53073.3835.720008825464332.44976.7 198814922.33801.5728.2200195727.973762.49457.6 198916917.85146.91374.22002103935.386910.613233.2 199018598.47119.81923.42003116603.2103617.716631.9 52 为了研究19782003年期间城乡居民储蓄存款随收入的 变化规律是否有变化,

20、考证城乡居民储蓄存款、国民总收 入随时间的变化情况,如下图所示: 53 从上图中,尚无法得到居民的储蓄行为发生明显改变 的详尽信息。若取居民储蓄的增量( ),并作时序 图(见左下图): 54 从居民储蓄增量图(上页左图)可以看出,城乡居 民的储蓄行为表现出了明显的阶段特征:在1996 年和2000年有两个明显的转折点。再从城乡居民 储蓄存款增量与国民总收入之间关系的散布图看 (见上页右图),也呈现出了相同的阶段性特征 。 55 为了分析居民储蓄行为在1996年前后和2000年前后三个阶段 的数量关系,引入虚拟变量 和 。 和 的选择,是以1996、2000年两个转折点作为依据, 并设定了如下以

21、加法和乘法两种方式同时引入虚拟变量的的 模型: 其中: 56 对上式进行回归后,有: 57 即有: 由于各个系数的t检验均大于2,表明各解释变量的 系数显著地不等于0,居民人民币储蓄存款年增加 额的回归模型分别为: 58 这表明三个时期居民储蓄增加额的回归方程在统计 意义上确实是不相同的。1996年以前收入每增加1 亿元,居民储蓄存款的平均增加0.1445亿元;在 2000年以后,则为0.4133亿元,已发生了很大变化 。 59 上述模型与城乡居民储蓄存款与国民总收入之间 的散布图是吻合的,与当时中国的实际经济运行 状况也是相符的。 需要指出的是,在上述建模过程中,主要是从教 学的目的出发运用

22、虚拟变量法则,没有考虑通货 膨胀因素。而在实证分析中,储蓄函数还应当考 虑通货膨胀因素。 60 1.虚拟变量是人工构造的取值为0和1的作为属性 变量代表的变量。 2.虚拟变量个数的设置有一定规则:在有截距项 的模型中,若定性因素有 个相互排斥的类型 ,只能引入 个虚拟变量,否则会陷入所 谓“虚拟变量陷阱”,产生完全的多重共线性 。 第八章 小 结 61 3.在计量经济模型中,加入虚拟解释变量的途径 有两种基本类型:一是加法类型;二是乘法类 型。以加法方式引入虚拟变量改变的是模型的 截距;以乘法方式引入虚拟变量改变的是模型 的斜率。 4.解释变量只有一个分为两种相互排斥类型的定 性变量而无定量变量的回归,称为方差分析模 型。 62 5.解释变量包含一个分为两种类型定性变量的回 归时,只使用了一个虚拟变量;解释变量包含 一个两种以上类型的定性变量的回归时,定性 变量有 种类型,依据虚拟变量设置规则引入 了 个虚拟变量。 6.解释变量包含两个(或 个)定性变量的回归 中,可选用了两个(或 个)虚拟变量去表示 ,这并不会出现“虚拟变量陷阱”。 63 7.以乘法形式引入虚拟解释变量的主要作用在于 :对回归模型结构变化的检验;定性因素间交 互作用的影响分析;分段线性回归等。 64 第八章 结 束 65

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1