回归分析基本方法最小二乘法.ppt

上传人:夺命阿水 文档编号:66185 上传时间:2025-07-09 格式:PPT 页数:45 大小:820.60KB
下载 相关 举报
回归分析基本方法最小二乘法.ppt_第1页
第1页 / 共45页
回归分析基本方法最小二乘法.ppt_第2页
第2页 / 共45页
回归分析基本方法最小二乘法.ppt_第3页
第3页 / 共45页
回归分析基本方法最小二乘法.ppt_第4页
第4页 / 共45页
回归分析基本方法最小二乘法.ppt_第5页
第5页 / 共45页
点击查看更多>>
资源描述

1、 假设检验的假设检验的基本思想基本思想基于基于小概率原理小概率原理的的反证法反证法二、假设检验的步骤二、假设检验的步骤1、提出假设,包括原假设和备择假设2、构造相应的检验统计量,确定其分布形式;根据样本数据计算统计量的值;3、确定显著性水平和临界值;4、作出结论。(根据所计算的统计量的值与临界值比较确定是否拒绝原假设)原假设原假设 The Null Hypothesis1.陈述需要检验的假设例如:H0:=452.原假设用 H0 表示3.总是包含等号“=”(比如=,)4.检验以“假定原假设为真”开始平均每天上网玩游戏时间不是5小时。如何设定假设检验?如何设定假设检验?H0:=5 H1:5例例 题

2、题 1 1据报导,美国全职教授年薪的数学期望值为68000美元,标准差为5000美元。一个由36名大学全职教授组成的样本表明,平均薪水为72000美元,检验报导的可信性。(显著性水平为0.02)H0临界值临界值临界值临界值/2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域非拒绝域非拒绝域接受域与拒绝域接受域与拒绝域抽样分布抽样分布1-置信度置信度(1)H0:=68000 H1;68000(2)检验统计量服从Z分布检验统计量检验统计量:(3)=0.02,查正态分布表得:Z=2.04,接受域为(2.04,2.04)结论:拒绝假定。质检员认为在整个工作流程中平均装盒量符合标准:没有超过36836

3、8克。随机抽取25盒盒为样本,均值,均值 X=372.5克,标准差克,标准差s=1=15 克。试在 =0.05的条件下进行检验。给出你的结论。368 克.例例 题题 2 2t0 拒绝H0t0拒绝H0 接受域与拒绝域接受域与拒绝域H0:0 H1:0必须显著低于才会拒绝小的数值与H0不矛盾.,因此不会拒绝 H0左侧检验右侧检验(1)H0:368 H1;368(2)检验统计量服从t分布检验统计量检验统计量:(3)=0.05,查t分布表得:t=2.064,接受域为(,2.064)结论:结论:接受原假定。假设检验中的两类错误假设检验中的两类错误检验决策错误检验决策错误第一类错误弃真错误,后果往往较为严重

4、出现第一类错误的概率为 ,等于显著性水平第二类错误 存伪错误,出现第二类错误的概率为 检验决策结果检验决策结果实际情况实际情况实际情况实际情况H0为真H0为假决策决策H0 为真 H0为假不拒绝不拒绝正确正确错误错误不拒绝不拒绝H0置信水平置信水平1-第二类第二类错误错误 拒绝拒绝错误错误正确正确拒绝拒绝H0第一类第一类错误错误 检验能检验能力力1-第三章 回归分析的基本方法:最小二乘法本章重点本章重点经济学理论模型最小二乘法实例应用2025/7/914中山大学南方学院经济系本章分析思路建立经济学的理论模型运用最小二乘法进行参数估计实例运用2025/7/9中山大学南方学院经济系15回归分析回归分

5、析研究步骤:研究步骤:首先,要确定所研究的问题(因变量),并根据经济理论,找出与该问题相关的、有影响力的经济因素(自变量),并建立因变量与自变量的关系式(经济模型)。2025/7/9中山大学南方学院经济系16其次,按照科学的方法收集相应变量的实际数据。最后,对所研究的问题作出结论。2025/7/9中山大学南方学院经济系17第一节 理论模型的建立简单回归模型 是指两个变量的线性模型,其中一个是因变量,一个是自变量。也称为“二元线性方程”。用数学公式表示就是:2025/7/9中山大学南方学院经济系18建立建立x解释解释y的模型时,面临三个问题的模型时,面临三个问题:(1)既然两个变量之间没有一个确

6、切的关系,应该如何考虑其他影响Y的因素?(2)Y和X的函数关系是怎样的?(3)怎样知道是否准确测定出了y和x之间的关系(因果性效应)?2025/7/9中山大学南方学院经济系1920计量经济学分析的应用:oy和x:某一个总体的两个变量o感兴趣:用x来解释y,或者说是研究y如何随x而变化如:(Y)大豆的产出与(X)化肥的用量;(Y)工资收入与(X)受教育的年数;(Y)社区的犯罪率与(X)警察的数量。在自己建立经济模型的过程中,如何取舍解释变量,一定要问个为什么。计量经济学家首先就是要摆事实、讲道理,这是作为计量经济学家必备的素质。1、消费与收入之间的关系;2、产品的销量与产品价格的关系;3、GDP

7、与投资、经济运行的关系。2025/7/9中山大学南方学院经济系2122一元回归的术语自变量(independent variable)解释变量(explanatory variable)控制变量(control variable)预测变量(predictor variable)回归元(regressor)因变量(dependent variable)被解释变量(explained variable)响应变量(response variable)被预测变量(predicted variable)回归子(regressand)XY23一元回归模型的定义变量:随机误差项误差项或随机扰动项扰动项表示:

8、除X之外其他影响Y的因素24随机误差项的产生一、理论的不确定性(现象的内在随机性)二、模型的简化核心变量与非核心变量忽略影响较小的因素因素三、数据测量、收集的误差四、模型函数形式设定错误25模型表述了Y和X之间的线性线性关系。简单线性回归模型简单线性回归模型(Simple linear regression model)又称做两变量两变量或双变量双变量线性回归模型线性回归模型 (The two variable regression model):y和x关系式中的斜率参数斜率参数(slope parameter):截距参数:截距参数(intercept parameter)26例1 大豆产出和

9、施肥量农业研究者对(其他因素不变时)化肥用量化肥用量如何影响大豆产出量如何影响大豆产出量感兴趣。随机误差项包括了:土壤质量、降雨量等因素土壤质量、降雨量等因素影响的效果由给出系数度量了在其他条件不变的情况下,施肥量对产出量的影响:yield=fertilizerq假使大豆的产出由以下模型所决定:27例2 简单的工资方程表示一个人的工资水平工资水平与他的受教育程度受教育程度及其他非观测因素的关系:qWage:工资水平qEduc:受教育的年数q:(在其他条件不变的情况下)每增加一年教育所获得的工资增长。q其他非观测因素q线性性显示,不管X的初始值为多少,它的任何一单位变化对Y的影响都是相同的相同的

10、28计量经济分析中的因果性效应与计量经济分析中的因果性效应与其他条件不变其他条件不变其他条件不变:包含在随机误差项中的其他所有相关因素均保持固定不变。因果性效应:其他条件不变情况下,一个变量对另一个变量产生的影响。第二节 实际数据的收集当我们建立了经济理论上的关系式后,接下来就要从实际中收集数据。Y和X是两个变量,我们要收集有关Y和X的数据,就要对N个研究对象进行观察,从而收集到N组数据,这每一组数据叫做一个“样本”,每个样本有一个对应的Y与X的值。2025/7/9中山大学南方学院经济系29于是,我们的回归模型就可以表示为:我们用所得到的数据,采用回归分析的方法来对模型中的参数进行估计。这样

11、我们就可以得到参数的估计值。被普遍采用的方法是“最小二乘法”。2025/7/9中山大学南方学院经济系30第三节 最小二乘法普通最小二乘估计量(ordinary least squares)OLS估计量2025/7/9中山大学南方学院经济系3132(1)OLS残差的平方和最小。数学表述为:OLS估计量的代数性质q OLS估计值是以使残差和为零的参数估计值来选择的。即OLS的一阶条件 我们试图找到这样一条直线,它到每一实际落点的距离的总和为最小。由于实际落点到直线的距离有正也有负值,即误差有正值和负值,我们用误差项的平方值来测定其绝对距离。所以我们可以通过全微分来求极值。2025/7/9中山大学南

12、方学院经济系33我们得出:我们得出:设一阶导数为零,可得设一阶导数为零,可得:2025/7/9中山大学南方学院经济系342025/7/9中山大学南方学院经济系35然后我们再求二阶偏导然后我们再求二阶偏导:由于二阶偏导大于零,所以我们确信这种所求的结果是最小值。这就是最小二乘法。2025/7/9中山大学南方学院经济系36一元线性回归模型的假设条件2025/7/9中山大学南方学院经济系371.X与与Y之间的关系是线性的。之间的关系是线性的。2.X是非随机的变量,它的值是确定的。是非随机的变量,它的值是确定的。3.误差项的期望为误差项的期望为0:E(i)=0。4.对于所有观测值,误差项具有相同的方差

13、对于所有观测值,误差项具有相同的方差,即即E(2 2)=2同方差假定同方差假定5.随机变量随机变量i 之间统计上是独立的,因此对所之间统计上是独立的,因此对所有的有的ij,E(i j)=0无序列相关假定无序列相关假定6.误差项服从正态分布。误差项服从正态分布。假设假设15:古典线性回归模型的定义:古典线性回归模型的定义 第四节 最小二乘法实用实例计量经济的回归分析主要是根据经济理论的数学模型和实际的经济数据来计算出符合实际的、可应用经济分析的参数方程。例如:我们估算某个地区的消费函数。根据经济理论,人们的消费额取决于他们的收入,也就是说消费与收入有线性关系,消费是因变量,收入是自变量。收入越

14、多消费也越多,收入越少消费也越少。2025/7/9中山大学南方学院经济系38用数学模型表示如下:这里,C表示因变量消费额,Y表示可支配收入。按照经济理论,参数系数应该大于零,或者说消费额与可支配收入的正相关的关系。2025/7/9中山大学南方学院经济系39我们把收集到的数据做成一个散点图。并用回归方法估计出来的回归结果如下(表3-2):C=131.8368+0.8663*Y这个分析的结果告诉我们,当收入等于零这个分析的结果告诉我们,当收入等于零时,此人应该靠借大约时,此人应该靠借大约132元来度日;人均元来度日;人均的消费是收入的的消费是收入的86.6,也就是说,平均每,也就是说,平均每挣一百

15、元,应该花掉八十六元六角三分钱。挣一百元,应该花掉八十六元六角三分钱。2025/7/9中山大学南方学院经济系40 这样,我们先从理论上的经济模型入手,再有采集的实际经济数据,然后用计量经济学的回归分析方法估计出适合于实际数据的数学模型。当然,我们还要对这个估计出来的数学模型进行统计测试,检验其估计参数的合理性和有效性。当其估计参数被测试为合理并且有效时,我们就可以说我们的经济理论被实践证明是正确的。这样,我们也就可以用这个模型来进行经济预测。2025/7/9中山大学南方学院经济系41 以上的例题,我们用的是一个横截面的数据来进行回归分析的,同时我们也可以用时间序列数据来进行分析,分析的方法和步

16、骤也是一样的。如我们分析不同年份的消费与可支配收入的关系。2025/7/9中山大学南方学院经济系42第五节 最小二乘法 在实际经济研究过程中,我们所面对的理论模型往往有几个或者很多自变量。那么,简单的模型就不够用了。下面我们来简单讨论一下多变量的通用模型。当数据中有一个因变量和K个自变量时,那么我们的回归分析模型就应该是:2025/7/9中山大学南方学院经济系43 这里,i=1,2,n.是估计参数,也就是模型的系数。E是模型的误差项。如果我们用矩阵的方式来表示就是:YXe 如果我们用实际数据来估计一个线性模型YXe,是这个模型中的真实的参数值。2025/7/9中山大学南方学院经济系44最佳估计值当估计值满足以下三个条件的时候,我们求出的估计值是最佳的估计值。(1)“线性的”是指YXe这个线性模型;(2)“无偏的”是指E()=。(3)“最好的”是指估计参数的方差会是最小的。只有当这些条件都满足了,我们的估计参数才是最优的。2025/7/9中山大学南方学院经济系45

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 大学课件

宁ICP备18001539号-1