数学专业毕业论文-多元线性回归模型在工业生产总值预测中的应用.doc

上传人:韩长文 文档编号:3932382 上传时间:2019-10-10 格式:DOC 页数:35 大小:1.24MB
返回 下载 相关 举报
数学专业毕业论文-多元线性回归模型在工业生产总值预测中的应用.doc_第1页
第1页 / 共35页
数学专业毕业论文-多元线性回归模型在工业生产总值预测中的应用.doc_第2页
第2页 / 共35页
数学专业毕业论文-多元线性回归模型在工业生产总值预测中的应用.doc_第3页
第3页 / 共35页
数学专业毕业论文-多元线性回归模型在工业生产总值预测中的应用.doc_第4页
第4页 / 共35页
数学专业毕业论文-多元线性回归模型在工业生产总值预测中的应用.doc_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《数学专业毕业论文-多元线性回归模型在工业生产总值预测中的应用.doc》由会员分享,可在线阅读,更多相关《数学专业毕业论文-多元线性回归模型在工业生产总值预测中的应用.doc(35页珍藏版)》请在三一文库上搜索。

1、上海电力学院学士学位论文摘 要许多经济现象往往不是简单的与某一因素有关而是要受多个因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归。本文在2007年全国各省市主要工业产品的产量与工业总产值的具体数据下,选用塑料、水泥、钢筋、平板玻璃、粗钢、盘条以及原煤等工业产品的产量作为研究对象,建立多元线性回归模型,并对模型做出参数估计.在此基础上对模型做出一定的解释,对于预测工业总产值具有一定的理论指导和现实意义。关键词:多元线性回归模型;显著性检验;SPSS;预测- I -The

2、 Application of Linear Regression Model in The Forecast of Gross Industrial ProductionAbstract Many economic phenomena are often not simply associated with a number of factors. At this point we need to use two or more factors as independent variables to explain changes in the dependent variable. Thi

3、s is also known as multiple regression. When more than one independent variable and the dependent variable are linear relationship, the regression analysis is carried out by diversity regression. This article use the specific data of the output of major industrial products and industrial output in n

4、ationwide provinces in 2007, and select the output of plastics, cement, steel, plate glass, crude steel, wire rod and raw coal as study object to establish multiple linear regression model, and then make the model parameter estimation. Based on this,we make some explanations to the model. All of the

5、se are of momentous current significance and far-reaching historical significance to the forecast of industrial production.Key Words:Multiple Linear Regression Model;Significant Test;SPSS- III -目 录摘 要IAbstractII目 录III引 言11 中国经济现状21.1 中国经济现状21.2工业生产总值的概述22 多元统计分析基础42.1多元线性回归模型42.1.1 模型的建立及矩阵表示42.1.2

6、模型的假设52.2 多元线性回归参数估计52.2.1 最小二乘估计和正规方程组52.2.2 最小二乘估计的矩阵形式62.2.3 最小二乘估计量的性质72.3 回归拟合度评价和决定系数82.3.1 离差分解和决定系数82.3.2 决定系数的性质及修正可决系数92.4 统计检验92.4.1回归参数的显著性检验(检验)92.4.2回归方程的显著性检验(F检验)102.4.3 多重共线性检验112.4.4 异方差检验123 工业生产总值的多因素模型分析143.1建立多因素分析模型143.2数据收集143.2.1 数据说明143.2.2 数据的搜集情况说明143.3 SPSS软件的使用163.3.1 S

7、PSS简介163.3.2 SPSS多元线性回归分析163.4 统计检验183.5 计量经济学检验及模型修正203.5.1 异方差检验203.5.2 自相关检验24结 论29参 考 文 献30致 谢31上海电力学院学士学位论文引 言工业生产总值从数值上反应一个地区的工业生产规模,是衡量一个地区的经济繁荣程度的重要指标。研究研究工业总产值与格工业产出指标之间的关系具有非常重要的现实意义,对于做好一个地区的的工业产值预测以及制定国民经济发展规划都有的非常重要的作用。 工业总产值 是指以货币表现的工业企业在一定时期内生产的已出售或可供出售的工业的产品的总量。它是反映一定时间内工业生产总规模和,总水平的

8、重要指标,是计算工业生产发展速度和主要比例关系,计算工业产品销售率和其他经济指标的重要依据。工业总产值包括成品价值、工业性作业价值和自制半成品、在产品期末期初差额价值。工业,总产值采用“工厂法”计算,即以工业企业作为一个整体,按企业工业生产活动的最终成果来计算。但各企业之间、行业之间、地区之间存在着重复计算。其计算公式为:报告期工业总产值=报告期全部产品的成品价值+报告期工业性作业价值+(报告期自制半成品和在产品期末余额- 报告期自制半成品和在产品期初余额) 计算工业总产值采用的价格有不变价格和现行价格1。1 中国经济现状1.1 中国经济现状改革开放30年来,中国经济持续高速增长,相当程度上是

9、依赖于中小企业的崛起。快速、健康和持续发展的中小企业,对经济增长的贡献有目共睹:在繁荣经济、促进增长、国际贸易、扩大就业、推动创新、提高消费能力等方面发挥着重要的作用,已成为推动我国经济社会发展的重要力量,是大企业发展的依托,是活跃市场的基本主体,也是经济活力的具体体现1。回顾2008年中国:我们经历了年初的雪灾、5月的地震灾害、8月承办奥运、中国股市连连下挫,上证指数从2007年的最高点6124点一路下滑至2008年8月份的最低点2284点、半年光景约有6.7万家中小企业倒闭、国际油价的居高不下,煤、电、油、运全面紧张。针对新局势、新变化,我国政府把防过热、防通胀的经济政策迅速调整为保发展、

10、控通胀。确保发展和控制物价是对立的统一,既有矛盾,也可以相互促进,关键在于我们采取什么样的政策,拉动GDP的三大要素是投资、消费和进出口,根据相关研究今年经济增长如果不超过9.4%,通货膨胀率控制在5%左右,就是一个很好的平衡点,能为明年打下一个好的基础2。 中国经济正处在低谷的边缘。因为我国经济面临内忧外患,内忧是通货膨胀,外患是全球经济放缓,这些都对我国经济有很大影响,我们正在经历着动荡的考验:美元走低、人民币升值、外需放缓,这对于对外依存度超过60%的中国经济,是一次巨大的挑战3。对于中小企业而言在投资和出口问题上主要依赖于国家的宏观调控,就困境中的中小企业本身来说基本上是无能为力的,然

11、而可以团结起来、集合资源,向管理要效益,向降低成本要效益,从扩大内需中要效益,那么就要进一步激励民众扩大内需、大力推动消费、刺激消费,寻找一种能够产生新的消费热情的方法上下功夫,在实现消费增值的基础上取得企业效益,从而保持企业持续健康的发展4。1.2工业生产总值的概述工业总产值是指以货币表现的工业企业在报告期内生产的工业产品总量。工业总产值按“工厂法”计算,即以工业企业作为一个整体,按企业工业生产活动的最终成果计算5。企业内部不允许重复计算,不能把企业内部各个车间生产的成果相加。工业总产值包括成品价值、对外加工费收入和自制半成品、在产品期末期初差额价值6。2 多元统计分析基础2.1多元线性回归

12、模型2.1.1 模型的建立及矩阵表示多元线性回归模型的一般形式是: (2.1)其中是回归系数,Y是被解释变量,,,是k个对Y有显著影响的解释变量(k2),是 反映各种误差扰动综合影响的随机项,下标i表示第i期观察值(,),=1,2.n。假设多元样本回归函数为:回归残差为:。由于有n期的观察值,这一模型实际上包含n个方程写成矩阵形式: (2.2)其中2.1.2 模型的假设因为多元线性模型的建立或选择过程包含相当的主观性,所依据的理论和经验也可能不正确,因此并不能保证模型符合变量的实际关系。而如果模型本身有问题,那么分析的有效性和价值就很难有保证,为了保证所分析的变量关系符合多元线性回归分析的基本

13、规定性,明确分析对象,保证回归分析的有效性和性质,也为了检验判断的依据,需要对多元线性回归模型作一些架设,共包括下列六条:(1)变量和,(=1,2.n)之间,存在线性随机函数关系,其中是随机误差项。(2)对应每组观测数据的误差项,都为零均值的随机变量,即的数学期望E()=0对=1,2.n都成立。(3)误差项的方差为常数,即 对=1,2.n 都成立(假设(2)成立为前提)。(4)对应不同观测数据的误差项不相关,即对任意的都成立(假设(1)成立为前提)。(5)解释变量是确定性变量而非随机变量。当存在多个解释变量(r1)时假设不同解释变量之间不存在线性关系,包括严格的线性关系和强的近似线性关系。(6

14、)误差项服从正态分布7。2.2 多元线性回归参数估计2.2.1 最小二乘估计和正规方程组这里直接根据回归残差平方和最小的准则,推导多元线性回归模型参数的最小二乘估计量。对于多元线性回归模型,如果用,分别表示模型参数,的估计,那么样本回归方程就是回归残差平方和为: (2.3)当V对,的一阶偏导数都等于0,即下列方程组:, ,同时成立时,V有最小值。对这个方程组整理,可得到如下的正规方程组:,其中,。上述正规方程组有K+1个方程,未知数也是K+1个。只要系数矩阵非奇异即满足解释变量矩阵列满秩:。此时,有,可逆。可以解出,的唯一的一组解,就是,的最小二乘估计8。2.2.2 最小二乘估计的矩阵形式引进

15、参数估计量,解释变量回归值和回归残差的下列向量表示:, , (2.4)把样本数据分别带入样本回归方程,得到回归方程组为: , (2.5) ,写成等价的向量方程,则为:这样回归残差向量为:在利用向量,矩阵的运算法则,可以得到残差平方和为=。求对,的偏导数,等价于对向量求梯度,因此最小二乘估计的正规方程组为:,整理得到矩阵形式:当可逆,也就是是满秩矩阵,在上述向量方程两端左乘的逆矩阵,得到: (2.6)这就是多元线性回归模型最小二乘估计的矩阵一般形式9。2.2.3 最小二乘估计量的性质(1)线性性:多元线性回归模型参数的最小二乘估计向量为:,各个参数的最小二乘估计向量为,其中的是矩阵的+1行元素构

16、成的行向量,上式对=1,K都成立,正是被解释变量观测值的线性组合,也就是多元线性回归参数的最小二乘估计是线性估计10。(2)无偏性:多元线性回归的最小二乘估计也是无偏估计,即参数最小二乘估计量的数学期望都等于相应参数的真实值,最小二乘估计向量的数学期望等于参数真实值的向量,参数真实值是参数估计量的概率分布中心。 (2.7)(3)最小方差性:根据最小二乘估计公式和模型假设,可以直接导出包含各个参数估计量方差和不同参数估计量协方差的,参数估计向量的协方差矩阵为: (2.8)2.3 回归拟合度评价和决定系数2.3.1 离差分解和决定系数判断回归结果好坏的基本标准,是回归直线对样本数据的逆合程度,称为

17、“拟合度”。回归直线的逆合度一方面取决于回归直线的选择,这就是由参数估计方法决定的,另一方面则取决于样本数据的分布。当参数估计方法固定时,主要取决于样本数据的分布。样本数据的分布在本质上是由变量关系决定的。因此回归拟合度也是检验模型变量关系真实性,判断模型假设是否成立的重要方法。拟合度较好是对模型的支持,否则,可能意味着必须对模型进行修改。首先需要从Y的离差中分离出由解释变量决定的部分,因变量的实际观测值与其样本均值的离差即总离差()可以分解为两部分:一部分是因变量的理论回归值与其样本均值的离差(), 它可以看成是能够由回归直线解释的部分,称为可解释离差;另一部分是实际观测值与理论回归值的离差

18、(),它是不能由回归直线加以解释的残差。 对任一实际观测值Y总有: (2.9)对公式(2.9)两边平方并求和并计算,可得到: (2.10)根据最小二乘估计和回归残差的相关公式,所有的离差的平方和记为=称为“总离差平方和”,而记为称为“残差平方和”, 记为称为“回归平方和”。式(2.10)两边同除以,得: (2.11)显而易见,各个样本观测点与样本回归直线靠的越近,在中所占的比重就越大。(2.11)式中的正是反映解释变量(或回归直线)对被解释变量决定程度的指标,我们称它为“决定系数”(determined coefficient),通常用表示。计算公式为: 。2.3.2 决定系数的性质及修正可决

19、系数决定系数是对回归模型拟合程度的综合度量,决定系数越大,模型拟合程度越高。决定系数越小,则模型对样本的拟合程度越差。决定系数具有如下性质:(1) 决定系数具有非负性。由决定系数的定义式可知,的分子分母均是不可能为负值的平方和,因此其比值必大于零。(2) 判定系数的取值范围为01。由的计算公式可以看出:当所有的观测值都位于回归直线上时,=0,这时=1,说明总离差可以完全由所估计的样本回归直线来解释;当观测值并不是全部位于回归直线上时, 0,则0,这时回归分析=线性,显示如下图3.1所示的对话框,选择。在左边列表框中选定变量Y,使之进入因变量框,选定变量,单击按钮使之进入自变量框。则显示如下图3

20、.2所示的对话框。 图3.1 选择因变量图3.2 选择自变量3.4 统计检验由SPSS计算结果表3.2 Variables Entered/Removed(b)ModelVariables EnteredVariables RemovedMethod1盘条x7, 塑料制品x1, 生铁x4, 平板玻璃x3, 水泥x2, 钢筋x6, 粗钢x5.Enter a All requested variables entered. b Dependent Variable: 工业总产值y表3.2 Model Summary(b)ModelRR SquareAdjusted R SquareStd. Err

21、or of the EstimateDurbin-Watson1.993(a).987.983245.843471.739 a Predictors: (Constant), 盘条x7, 塑料制品x1, 生铁x4, 平板玻璃x3, 水泥x2, 钢筋x6, 粗 钢x5 b Dependent Variable: 工业总产值y表3.3 ANOVA(b)ModelSum of SquaresdfMean SquareFSig.1Regression105370311.469715052901.638249.059.000(a) Residual1390097.2462360439.011 Total

22、106760408.71430 a Predictors: (Constant), 盘条x7, 塑料制品x1, 生铁x4, 平板玻璃x3, 水泥x2, 钢筋x6, 粗钢x5 b Dependent Variable: 工业总产值y表3.4 Coefficients(a)ModelUnstandardized CoefficientsStandardized CoefficientstSig.Collinearity StatisticsBStd. ErrorBetaToleranceVIF1(Constant)-2.21147.145 -.047.963 塑料制品x1.989.452.3172

23、.187.039.02737.156 水泥x2.036.024.4601.535.138.006158.745 平板玻璃x3-.055.056-.281-.978.338.007145.392 生铁x4.013.154.058.083.934.001858.829 粗钢x5.004.176.020.024.981.0011170.904 钢筋x6.456.362.4411.260.220.005216.237 盘条x7-.016.499-.012-.032.975.004242.790a Dependent Variable: 工业总产值y即有: =0.987 =0.983 =249.059方

24、程的决定系数较高,=0.987,修正可决系数=0.983,又回归模型拟合程度与决定系数有关,决定系数越大,模型拟合程度越高,可见本模型拟合程度较好,又F=249.05910, 模型总体显著性检验得知模型总体显著,也就是全体解释变量总体对被解释变量存在明显影响。对t检验由上述分析结果知,除粗钢和原煤外其余预测变量都是显著的。故我们对上述模型进行计量经济学的检验,并进行修正,看是否能使模型方程得到改进。 其中我们看到平板玻璃和盘条产量的系数是负值,一般来说,平板玻璃和盘条产量等经济发展量应该与工业总产值成正比关系,但由于在研究具体某个地区的经济发展关系时,由于政策领导或其它的因为地区的特殊性的原因,造成了平板玻璃和盘条产量的系数是可能成为负值的。比如工业总产值在下降,但是因为政策或其它原因平板玻璃和盘条产量却在上升,或工业总产值在上升,但是平板玻璃和盘条产量却在下降。3.5 计量经济学检验及模型修正3.5.1 异方差检验计算残差绝对值与个自变量

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1