基于arima模型的工业总产值时间序列分析.docx

上传人:scccc 文档编号:13250406 上传时间:2021-12-20 格式:DOCX 页数:15 大小:18.95KB
返回 下载 相关 举报
基于arima模型的工业总产值时间序列分析.docx_第1页
第1页 / 共15页
基于arima模型的工业总产值时间序列分析.docx_第2页
第2页 / 共15页
基于arima模型的工业总产值时间序列分析.docx_第3页
第3页 / 共15页
基于arima模型的工业总产值时间序列分析.docx_第4页
第4页 / 共15页
基于arima模型的工业总产值时间序列分析.docx_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《基于arima模型的工业总产值时间序列分析.docx》由会员分享,可在线阅读,更多相关《基于arima模型的工业总产值时间序列分析.docx(15页珍藏版)》请在三一文库上搜索。

1、基于arima模型的工业总产值时间序列分析基于arima模型的工业总产值时间序列分析基于ARIMA模型的工业总产值时间序列分析摘要:工业的发展情况能在莫种程度上反映当地的经济水平,对大量的工业总产值数据进行定性与定量的分析,能够在一定程 度上刻画数据变化的规律,并根据得由的规律建立适当的数 学模型,从而预测以后的工业总产值数据。本模型以奥地 1990年-1997年的工业总产值历史数据为 基础,基于 Eviews以及spss的分析与检验,对数据进行了 变化特征的分析处理,在此基础上进行了差分和取对数等数 据处理后,得到平稳序列。除此之外,本文还运用Eviews软件分离由季节因子之后,同时求生季节

2、因子,并建立了适当的 ARIMA模型,然后再 对模型进行检验。最后将预测结果与真实值进行比较,结果表明拟合度较 好,具有一定的实用性。关键词:时间序列 工业产值 季节因子 EViews SPSS ARIMA 模型 1、问题重述 在科学技术迅速发展的当今时代,一个国家 的工业化水平是衡量一个国家的综合国力大小强弱的重要 指标。它直接影响这个国家的政治经济的发展所以每个国家都在积极发展自己的工业,提高工业化的水 平跻身于世界工业强国之列。对工业总产量进行研究,找由其内在规律,预测未来,从 而能根据预测数据提由相关政策建议,对促进工业乃至整个 国家的经济发展具有重大的意义。根据所给的奥地工业总产值的

3、历年数据(数据见附录1),从而来探究以下的问题:1)根据数据分析当地工业总产值的变化特征.2)根据变化特征试建立合理的模型描绘这种特征3)若有季节性变化,试分离由季节性变化因子,求生季节性因子.2、数据处理1) 我们来用Excel软件求生来各年度的工业总产值之和,平均 数以及各个月份的平均数据, 并画由来相关图像(见附录2)。另外,我们还运用了 SPSS软件对个年份之间的数据进行 相关性分析1,我由个年份工业总产值之间的关系。表1生产总值的年度数据 表2各个月份的平均数据 2) 根据表中工业总产值的数据,我们先生成时间序列图进行分析,利用Eviews程序得到图1。图1原始工业生产总值数据图观察

4、图形,发现序列具有明显的增长趋势,由此初步判断使用时间序列模型来进行建 模分析。3、问题分析根据所给的总产值数据,我们分别对各个 年份和各个月份之间的数据进行计算和分析,再分析各年份数据之间的相关性,以便分析当地工业总产值的变化特征。由我们所分析的数据结果和所得到的原始数据图像,我们 必须综合各方面来进行建模。对于问题1)我们运用相关软件结合图像和相关理论知识 分析数值特点。对于问题2)工业生产总值数据是时间序列数据2,在原始数据的基础上建立由平稳的时间序列,再根据自相关和偏 相关图像确定相关模型的阶数,利用Eviews做由ARMA模型的参数估计3,最终确定所合理的模型来描绘数据的变化 特征。

5、对于问题3)在问题2)的基础上,再结合附录 2中的图 2,我们认为该组数据有季节变化的因素,运用季节乘法模 型离由季节性变化因子,求生季节性因子。四、模型假设 1)假设表1的工业总产值数据都准确无 误、真实。2)假设工业总产值不会受其他因素的影响,只受季节性 的影响。3)假设在获取数据的途中,没有太大的影响因子导致数 据大幅度的变化。5、符号说明-工业总产值的月份数据。-年度工业总产值之和。-年度平均工业总产值。-工业总产值的月份数据取对数后再进行一阶差分。-数据消除季节性因子后的数据。6、模型建立1)关于问题1的求解:分析表1中的数据和附录2中的图1,我们可以很直观地看 到年度工业总产值是在

6、逐年增长的,并且 1997年的年度工 业总产值为 53805.72,是1990年工业总产值 19737.20的 2.7倍,在七年内,该地区的工业总产值将近翻了两倍,说 明工业发展速度之快。再观察1990年-1997年八年内各个月份的平均数据,结合相关图像如下:图2各月平均数据图我们可以看到该数据在各个月份的分布是不均匀的,在1到2月份总产值普遍较低,其中 2月 份总产值为12个月中的最低值2309.98,之后开始逐渐上升, 而到了 7月份左右,有了相对的下降趋势,直到 9月份又开 始回升,其中12月份的工业总产值达到全年最高 3739.844875。接下来,我们又通过spss软件4我由表1工业

7、总产值之间的相互关系,对其进行二元变量的相关分析1。结果如下:x0 x1 x2 x3 x4 x5 x6 x7 x0 Pearson 相关性 1 .766(*) .625(*) .676(*) .639(*) .663(*) .719(*) .663(*) x1 Pearson 相 关 性.766(*)1 .938(*) .818(*) .944(*) .922(*) .909(*) .956(*) x2Pearson 相 关 性.625(*).938(*)1 .922(*) .996(*) .981(*) .896(*) .976(*) x3 Pearson 相关 性.676(*).818(*

8、).922(*)1 .930(*).954(*).878(*) .897(*) x4 Pearson 相 关性.639(*).944(*).996(*).930(*)1.990(*).924(*).986(*) x5 Pearson 相关性 .663(*).922(*).981(*).954(*).990(*)1.940(*).985(*) x6 Pearson 相 关性.719(*) .909(*) .896(*) .878(*) .924(*) .940(*)1.939(*) x7 Pearson 相 关性.663(*) .956(*) .976(*) .897(*) .986(*) .9

9、85(*) .939(* *) 1表3各年份数据变量之间的相关性注:代表1990年,代表1991年,代表1992年,代表1993年,代表1994年,代表1995年,代表1996年,代表1997年。*在0.01水平(双侧)上显著相关。*在0.05水平(双侧)上显著相关。在表3中,每个行变量与列变量交叉单元格处是二者的 相关统计量。1990年工业总产值与1992年、1993年、1994年、1995年、1997年工业总产值之间的相关系数依次为0.625、0.676、0.639、0.663、0.663,1990年工业总产值与这几年的工业总产值虽然有一定的正相关关系,但相关系数普遍较低。而自从1991年

10、开始,各个年份之间的相关系数都是明显 显著的,具有高度的正相关关系。特别地,1992年工业总产值与 1994年工业总产值的相关 系数为0.996,说明这两年的工业总产值之间具有非常密切 的关系。这些结果提供的信息与实际情况基本一致,反映了1990年的工业总产值可能是因为机器设备不完善、技术水平落后、管理机制不合理等一系列原因导致的,从 1991年开始 可能由于机器的购置,人才的引入,管理机制的改善等原因, 造成与1900年工业总产值之间的一定程度的差异。2)关于问题2的求解:把原始数列看成一个随时间推移而形成的随机时间序列,分析时间序列的特征,对工业总产值数据y进行ARMA模型的拟合。根据时间

11、序列的折线图(图1),可以看由序列是非平稳的。根据软件,我们可以分离由该序列的长期趋势图如下:图3奥地的工业总产值的长期趋势图为了消除趋势同时减小序列的波动,便于能够对序列进行分析,要对数据做平 稳化处理。常用的有两种方法:取对数法和差分法,本文采用的是两者结合的方法,对序列 进行处理。我们先定义了一列新的数据 dy,为原始数据取对数后一 节差分后所得,即dy=log(y)-10g(y(-1),并得到了相关折线图 (图4),根据图像,我们可以很清楚地看到该序列趋于平稳, 大部分数据在水平线上下浮动。图4原始数据取对数后一节差分后的数据图像由于谬误相关和谬误回归问题的存在,检验变量的非平稳性就显

12、得 十分重要了,用相关图可以判断时间序列的非平稳性,通过 图形也可以直观地判断,但相比之下,运用统计量进行统计 检验将会更为准确。以下我们将用统计检验中最为普遍应用的一种检验方法, 也是检验序列平稳性的标准方法:单位根检验法。所以我们对dy序列数据进行了 ADF检验结果,如图 5 所示。图5 dy序列的ADF检验 检验结果表明t统计量的值是 -3.990087均小于1%、5%、10%下的检验值,且其p值0.0023 也小于0.05。所以,至少可以在 99%的置信度下拒绝原假设,认为该时 间序列dy (dy=log(y)-log(y(-1)不存在单位根,即 dy为一 个平稳的时间序列。ARMA

13、(p, q)模型的识别与定阶可以通过样本的自相关与偏自相关函数的观察获得。log(y) 一阶差分后自相关与偏自相关系数如图 6图6 dy的 自相关与偏自相关图其自相关与偏自相关图显示序列的趋势已经基本消除,dy序列的自相关系数在滞后二期后呈衰减 趋于零,表现为拖尾性;在偏自相关分析图中,滞后五期的 偏自相关系数显著不为零,但之后逐渐衰减趋于零,也可以 认为序列的偏自相关系数也具有拖尾性。所以我们初定 AR的阶数为5,MA的阶数为2,建立ARMA(5,2)模型,其参数估计如下:图7 ARMA (5,2)模型的参数估计 另外,我们还进行了 ARMA (5,1)、ARMA (5,0)、ARMA (4

14、,2)、ARMA (4,1) 和ARMA (4,0)等模型分别作了参数估计,其结果见附录3,综合以上六种模型的参数估计,我们根据比较可知,ARMA(5,2)模型的所有系数都通过了假设检验,且拟合优度比其他五个模型都大,故初步选择 ARMA (5,2)模型更合适。为了检验该模型的合理性,我们还作了模型检验,首先 画由来ARMA (5,2)模型的残差序列图如下:图8 ARMA (5,2)模型的残差序列图 同时我们还对 ARMA(5,2)模型做残差序列检验,残差相关系数如下:图9 ARMA (5,2)模型的残差相关系数 结果显示,检验统 计量Q值均小于对应自由度卡方分布的检验值,且 Prob列 读生

15、拒绝原假设的概率较大,均大于 0.05,所以残差序列为 白噪声序列2,即ARMA (5,2)模型通过检验,所以最终 选择ARMA (5,2)模型。因此从图7 ARMA (5,2)模型的参数估计可知,ARMA(5,2)模型为:去掉差分后形式为:将对数形式化为指数形式,得到最终的模型是:3)关于问题3的求解:由于图2各月平均数据图可以观察到,该列时间序列的数 据是存在季节性因素的,于是我们将图6的自相关和偏自相关系数的阶数扩大为 25后,我们得到如下图像:图10 dy的25阶自相关与偏自相关图由图10可以看由,取对数一阶差分后序列的自相关系数并没有呈衰减趋于零; 在偏自相关分析图中,滞后的偏自相关

16、系数显著不为零,也 可以认为序列的偏自相关系数不具有拖尾性和结尾性,因此 阶数p在此时还不能确定.但当k=12时,样本的自相关系数 和偏相关系数显著不为0,表明季节性因素存在,故我们用Eviews软件画由来其季节因子图:图11季节因子图 另外再用spss对模型进行季节性因子4 分析得到如下结果:seasonal Factors series Name:y Period 1 2 3 4 5 6 seasonal Factor -343.43 -663.48 55.81 116.11 252.34 340.75 Period 7 8 910 11 12 seasonal Factor -135.6

17、9 -136.37 -30.73 -5.44 112.99437.45表4季节性因子 从表中可以看到季节性因子为负数 的说明对应月份的生产值不高,且负数值的绝对值越大,表 明对于的数字受季节影响却大且为负方向变动,如在表4中,2月份对应的季节因子数值为负数,且绝对值最大,故 2月 份对应的工业总产值最小,同理,12月所对应的季节因子为正值,且是最大,所以 12月份的数据应该为一年中的最大 值。观察图2我们会发现这一结论与 Eviews程序得由的图结果 是一致的,即与实际情况是一致的。同时,根据季节乘法模型,我们还分离由来该时间序列数据中的不规则因子如下:图12不规则因子图 根据以上分析,我们定

18、义新的序列sd做季节差分去掉了时间序列中的季节成分,并对该序列进行 单位根检验,结果表明该序列为平稳序列。图13 sd的ADF检验 该平稳序列的自相关系数和偏自相关系数图如下:图14 sd序列的自相关与偏相关函数由图可以看由,sd序列的自相关系数在滞后一期后呈衰减趋于零,表现为拖尾 性;在偏自相关分析图中,滞后三期的偏自相关系数显著不 为零,但之后逐渐衰减趋于零,也可以认为序列的偏自相关 系数也具有拖尾性,对序列sd进行0均值检验,得到该序列样本平均数是-0.0020,均值标准误为0.0038,序列均值与0无显著差别,表明序列可以直接建立季节模型。因此阶数p可由显著不为零的偏自相关系数的数目决

19、定2,观察图ar可以取3, ma可以取1。因为在问题2的基础上,原始数据经过一阶差分,序列趋势消除,故d=1;经过一阶季节差分,季节性基本消除,故 D=1。所以选用模型。记取自然对数一阶差分后的工业总产值序列为dyo观察序列sd的偏自相关图,如图5所示,p=2或p=3比较 合适;自相关图显示 q=1。综合考虑,可供选择的(p,q)组合有:(3,1), (4,0) , (2,1)和(3,0)。由于k=12时,样本自相关和偏相关系数都显著不为 0,所 以P=q=1下面分别对,和模型进行参数估计(见附录4),于 是又对模型进行参数检验,结果如下:图15模型的参数检验 系数检验均已通过,且模型的拟合

20、度较好。与问题2模型的检验一样,我们对模型进行检验,分别画 由来该模型的残差序列图和残差的自相关和偏相关图像如下:图16模型的残差序列图 图17模型的残差序列自相关与偏相关图 结果显示,检验统计量 Q值均小于对应自由度卡 方分布的检验值,且Prob列读生拒绝原假设的概率较大,均大于0.05,所以残差序列为白噪声序列 10,即模型通过检 验,所以最终选择模型奥地工业总产值进行分析预测。预测图如下:图18模型的预测图 从以上图中的数据知道 MAPE值均小 于5,表明该模型精度已经极高,模型可用,而且通过试验, 故选用该模型。与1997年的真实值比较如下表:表5 1997年的真实值与预测值的比较 根

21、据比较结果可以 看由,模型所预测的1997年的数据与1997年的真实数据比 较接近,进一步说明该模型的实用性。另外,计算结果显示模型拟合效果明显不如其他三个模 型,故不予考虑。比较其他三个模型的检验结果,与另外两个模型相比,模 型的AIC和SC值较小,试预测的MAPE值显示其预测精度 最高,调整后的样本决定系数 (Adjusted 2R)虽略小于模型, 但是优于模型,并且参数估计结果还显示这三种模型均有未 通过检验的参数系数,故不予考虑。因此我们最终认为模型比较合适。综上所述,模型的展开式为:于是,我们用该模型对该地1998年的工业总产值进行了预测,从Eviews软件中我们得到FY序列调生的结

22、果如下:图18对1998年工业总产值的数据预测7、模型的评价及改进1.模型优点:1) ARMA模型是一种常用的随机时间序列模型,本模型通过折线图和相关及偏自相关分析可以明显的看由该工业的 总产值随时间的变化而增长,并且有明显的季节性变化。2)建立ARIMA模型对各模型进行参数估计和模型检验, 通过消除平稳性和季节性,最终预测由1998年各月的生产总值也符合该工厂生产总值的增长趋势。3)建立季节性模型时,用Eviews软件分离由了季节性因 子并消除季节性,并且同时运用 SPSS软件战由来阶因子, 这对模型有着很重要的意义。4)根据以上的对比,发现 ARMA模型能比较好的分析、 计算我国工业的发展

23、波动情况,具有较好的应用前景。2.模型缺点:1)不利于变动范围大的处理。2)模型模拟实验结果与实际情况可能会有偏差,可能存 在的因素有选取的数据上存在一定的误差和参数估计模型 检验等误差。故该模型仍需有修正和完善之处。8、参考文献1作者:何晓群刘文卿书名:应用回归分析 北京 中国人民大学生版社2001年2作者:王振龙胡永宏书名:应用时间序列分析北京 科学生版社2007年3作者:易丹辉书名:数据分析与 EViews应用 北京 中国人民大学生版社 2008 年4作者:郝黎仁樊元书名:spss实用统计分析 北京 中国水利水电由版社2001年15附录1奥地的工业总产值数据表.年月1990 1991 1

24、9921993 1994 1995 1996 1997 1 月 1421.4 1757.8 1984.2 2179.1 2903.3 2996.7 3476.6 3843.84 2 月 1367.4 1485.7 1812.4 2408.7 2513.8 2740.3 2970.3 3181.26 3 月 1719.7 1893.9 2274.7 2869.4 3409 3580.9 3942.6 4404.49 4 月 1759.6 1969.8 2328.9 2916.7 3499.5 3746.3 4067.6 4520.18 5 月 1795.7 2033.7 2373.1 3022.

25、1 3642.6 3817.9 4746.899 4638.99 6 月 1848.1 2103 2515.8 3274.5 3871.4 4046.6 4417.299 4969.93 7 月 1637.3 1836.3 2288 2862.9 3373 3483.9 3806.8 4146.899 8 月 1637.6 1914.7 2321 2864.2 3463.4 3510.6 3746.3 4198.7 9 月 1637.6 2022.2 2441.1 2908 3663.74 3703.1 4011.1 4536.839 10 月 1637.6 2045.1 2502.6 291

26、1.8 3753.38 3810.74129.6 4783.91 11 月 1637.6 2069.2 2608.8 3101.3 3973.174091 4372.199 5034.939 12 月 1637.6 2136 2823.8 3664.34469.02 4650.799 4991.5 5545.74 附录 2 图 1 年度总产值之和数据图 图2各月平均数据图 附录3图1 ARMA (5,2)模型的参数估计 图2 ARMA (5,1)模型的参数估计图3ARMA (5,0)模型的参数估计图4 ARMA (4,2)模型的参数估计 图5 ARMA (4,1)模型的参数估计 图6 ARMA (4,0) 模型的参数估计 附录4图1模型的参数估计 图2模型的参数估计 图3模型的参数估计 图4模型的参数估计

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1