数学建模中的预测方法：时间序列分析模型.ppt

资源描述

《数学建模中的预测方法：时间序列分析模型.ppt》由会员分享，可在线阅读，更多相关《数学建模中的预测方法：时间序列分析模型.ppt（50页珍藏版）》请在三一文库上搜索。

1、数学建模中的预测方法,应用案例：（1）CUMCM2001-A:血管的三维重建问题；（2）CUMCM2003-A:SARS的传播问题；（3）CUMCM2005-A:长江水质的评价与预测；（4）CUMCM2006-B:艾滋病疗法的评价与预测。,1. 插值与拟合方法：小样本内部预测,应用案例：（1）CUMCM2004-A:奥运临时超市网点设计；（2）CUMCM2004-B:电力市场的输电阻塞管理；（3）CUMCM2005-A:长江水质的评价与预测；（4）CUMCM2006-B:艾滋病疗法的评价与预测；（5）CUMCM2008-B:高校学费标准探讨问题。,2.回归模型方法：大样本的内

2、部预测,3.灰预测GM(1,1)：小样本的未来预测,应用案例（1）CUMCM2003-A:SARS的传播问题；（2）CUMCM2005-A:长江水质的评价与预测；（3）CUMCM2006-B:艾滋病疗法的评价与预测；（4）CUMCM2008-B:高校学费标准探讨问题。,应用案例（1）CUMCM2003-A:SARS的传播问题；（2）CUMCM2005-A:长江水质的评价与预测；（3）CUMCM2006-B:艾滋病疗法的评价与预测。,5.神经网络方法：大样本的未来预测,4.时间序列方法：大样本的随机因素或周期特征的未来预测；,时间序列分析模型,一、时间序列分析模型【ARMA模型】

3、简介,1、概述,ARMA模型是一类常用的随机时间序列模型，是一种精度较高的时间序列短期预测方法.,通过对模型的分析研究，能够更本质地认识时间序列的结构与特征，达到最小方差意义下的最优预测.,三种基本类型：自回归（AR：Auto-regressive）模型；移动平均（MA：Moving Average）模型；自回归移动平均（ARMA：Auto-regressive Moving Average）模型,（1）自回归【 AR 】模型,自回归序列：,【1】,【1】式称为阶自回归模型，记为AR（）,注1：实参数称为自回归系数，是待估参数.随机项是相互独立的白噪声序列，且服从均值为0、方差为的

4、正态分布. 随机项与滞后变量不相关。,注2：一般假定均值为0，否则令,记为步滞后算子，即，则模型【1】可表示为,令，模型可简写为,AR（）过程平稳的条件是滞后多项式的根均在单位圆外,【2】,（2）移动平均【MA】模型,移动平均序列：,【3】,式【3】称为,阶移动平均模型，记为MA（）,注：实参数,为移动平均系数，是待估参数,引入滞后算子，并令,则模型【3】可简写为,注1：移动平均过程无条件平稳,注2：滞后多项式的根都在单位圆外时，AR过程与MA过程能相互表出，即过程可逆，,【4】,注3：【2】满足平稳条件时，AR过程等价于无穷阶的MA过程，即,（3）自回归移动平均【ARMA

5、】模型【B-J方法建模】,自回归移动平均序列：,【5】,【5】称为阶的自回归移动平均模型，记为ARMA,注1：自回归系数,移动平均系数,注2：【1】和【3】是【5】的特殊情形,注3：引入滞后算子，模型【5】可简记为,【6】,注4：ARMA过程的平稳条件是,的根均在单位圆外,可逆条件是,的根都在单位圆外,2、随机时间序列的特性分析,（1）时序特性的研究工具,1）自相关,构成时间序列的每个序列值之间的简单相关关系称为自相关。,自相关程度由自相关系数度量，表示时间序列中相隔期的观测值之间的相关程度。,2）偏自相关,偏自相关是指对于时间序列，在给定的条件下，与之间的条件相关关系。其相关

6、程度用偏自相关系数度量，有,其中是滞后期的自相关系数，,（2）时间序列的特性分析,1）随机性,如果一个时间序列没有任何规律性，序列诸项之间不存在相关，即序列是白噪声序列，其自相关系数应该与0没有显著差异。,2）平稳性,若时间序列满足,1）对任意时间，其均值恒为常数；,2）对任意时间和，其自相关系数只与时间间隔有关，而与和的起始点无关。那么，这个时间序列就称为平稳时间序列。,3）季节性,时间序列的季节性是指在某一固定的时间间隔上，序列重复出现某种特性.比如地区降雨量、旅游收入和空调销售额等时间序列都具有明显的季节变化.,一般地，月度资料的时间序列，其季节周期为12个月；季度资

7、料的时间序列，季节周期为4个季.,判断时间序列季节性的标准为：自相关系数是否与0有显著差异。,实际问题中，常会遇到季节性和趋势性同时存在的情况，这时必须事先剔除序列趋势性再用上述方法识别序列的季节性，否则季节性会被强趋势性所掩盖，以至判断错误.,包含季节性的时间序列也不能直接建立ARMA模型，需进行季节差分消除序列的季节性，差分步长应与季节周期一致.,3、模型的识别与建立,在运用B-J方法建模时，应运用序列的自相关与偏自相关对序列适合的模型类型进行识别，确定适宜的阶数！,（1）自相关函数与偏自相关函数,1）MA（）的自相关与偏自相关函数,自协方差函数,是白噪声序列的方差,样本自相关函数,MA

8、（）序列的自相关函数在以后全都是0，这种性质称为自相关函数的步截尾性；,偏自相关函数随着滞后期的增加，呈现指数或者正弦波衰减，趋向于0，这种特性称为偏自相关函数的拖尾性,2）AR（）序列的自相关与偏自相关函数,偏自相关函数,是步截尾的；,自协方差函数,满足,自相关函数,满足,它们呈指数或者正弦波衰减，具有拖尾性,3）ARMA（）序列的自相关与偏自相关函数均是拖尾的,（2）模型的识别,自相关函数与偏自相关函数是识别ARMA模型的最主要工具，B-J方法主要利用相关分析法确定模型的阶数.,若样本自协方差函数在步截尾，则是MA（）序列,若都不截尾，而仅是依负指数衰减，这时可

9、初步认为是ARMA序列，它的阶要由从低阶到高阶逐步增加，再通过检验来确定.,若样本偏自相关函数在步截尾，则是AR（）序列,1）的截尾性判断,对于每一个,，计算,考察其中满足,或,的个数是否为的68.3%或95.5%。,如果当时，明显地异于0，而近似为0，且满足上述不等式的个数达到了相应的比例，则可近似地认为在步截尾,2）的截尾性判断,作如下假设检验：,存在某个，使，且统计量,表示自由度为的分布的上侧分位数点,对于给定的显著性水平,则认为样本不是来自AR（）模型；,可认为样本来自AR（）模型。,3）AIC准则确定模型的阶数,AIC定阶准则：,是模型的

10、未知参数的总数,是用某种方法得到的方差的估计,为样本大小，则定义AIC准则函数,用AIC准则定阶是指在的一定变化范围内，寻求使得最小的点作为的估计。,AR（）模型：,ARMA 模型：,（3）参数估计,在阶数给定的情形下模型参数的估计有三种基本方法：矩估计法、逆函数估计法和最小二乘估计法，这里仅介绍矩估计法,1）AR（）模型,白噪声序列的方差的矩估计为,2）MA（）模型,3）ARMA 模型的参数矩估计分三步：,i）,的估计,ii）令,，则,的自协方差函数的矩估计为,iii）把近似看作MA（）序列，利用 2）对MA（）序列的参数估计方法即可,（4）模型检验,通过相关分析法

11、和AIC准则确定了模型的类型和阶数，用矩估计法确定了模型中的参数，从而建立了一个ARMA模型，来拟合真正的随机序列。但这种拟合的优劣程度如何，主要应通过实际应用效果来检验，也可通过数学方法来检验。,下面介绍模型拟合的残量自相关检验，即白噪声检验：,对ARMA模型，应逐步由ARMA（1，1），ARMA（2，1），ARMA（1，2），ARMA（2，2），依次求出参数估计,一般地，对ARMA模型,取初值,可递推得到残量估计,现作假设检验：,是来自白噪声的样本,其中取左右。,当成立时，服从自由度为的分布。,对给定的显著性水平,则拒绝,则拟合较好，模型检验通过,需重新考虑建模,4、模型的预测

12、,B-J方法采用L步预测，线性最小方差预测是常用的一种方法.其主要思想是使预测误差的方差达到最小.若用表示模型做的L步平稳线性最小方差预测，那么，预测误差,并使达到最小.,1）AR（）序列预测,模型（1）：,的L步预测值为,其中,2）MA（）的预测,对模型（3）：,当,时，由于,可见所有白噪声的时刻都大于,，故与历史取值无关，,；,从而,递推时，初值,均取为0。,当,时，各步预测值可写成矩阵形式：,二长江水质污染的发展趋势预测【CUMCM 2005A】,题中给出了“19952004年长江流域水质报告”中的主要统计数据和关于地表水环境质量标准的国标（GB3838-2002）中4个主要

13、项目标准限值（见附录1），其中I、II、III类为可饮用水.假如不采取更为有效的治理措施，根据过去10年的主要统计数据（见附录2），对长江未来水质污染的发展趋势做出预测分析，比如研究未来10年的情况.,1、问题分析,对未来10年全流域、支流、干流中三类水所占的比例做出预测. 若仅用10年水文年的观测数据来预测后10年的数据，可利用的数据量太少，所以我们将充分利用枯水期、丰水期和水文年的数据. 我们将一年分为三段，1-4月、5-8月、9-12月. 1-4月的平均数据可直接取为枯水期的数据，5-8月的平均数据可直接取为丰水期的数据，而9-12月的数据可用【（水文年*12-枯水期*4-丰水期*4）/

14、4=水文年*3-枯水期-丰水期】来估计（具体数据见附录3）.我们分别对全流域、干流、支流来建立时间序列模型，并将水质分为饮用水（I、II、III类）、污水（IV、V类）和劣V类水三类.,2、模型假设,（2）假设枯水期、丰水期和水文年中，每个月各类水质的百分比不变.,（1）问题中所给出的数据能客观反映现实情况；,3、模型建立,对于各类水在各个时期所占的比例通过适当差分建立自回归移动平均模型ARIMA.,在实际建模中，考虑到一期的数据应该与前期的数据有关，所以对差分后的平稳序列我们建立ARMA模型.,在这里，我们不考虑随机干扰项建立AR模型,仅以预测干流中劣类水所占比例的 ARIMA 模型为例，详

15、细叙述一下 ARIMA 建模过程。,（1）数据筛选与处理,根据需要，我们将数据筛选并处理得到干流中劣类水所占比例的时间序列：,=0，4，-4，0，1.5，-1.5，0，0，0，0，0， 0，0，0，0，0，0，0，6.9，5.1，5.4，7.9， 4.8，13.4，0，0，0，14.2，9.3，3.5，,（2）对序列平稳化,观察序列时序图，发现序列有递增趋势,进行一阶差分,0，4，-8，4，1.5，-3，1.5，0，0，0， 0，0，0，0，0，0，0，0，6.9，-1.8，0.3， 2.5，-3.1，8.6，-13.4，0，0，14.2， -4.9，-5.8 ,劣类水所占比例时序图,利用公

16、式,计算自相关系数,明显异于0,可初步认为经1阶差分后的序列平稳，即,1阶差分后的白噪声检验结果如下：,在检验的显著性水平取为0.05的条件下，P值大于0.05，故该差分后序列可视为白噪声序列,（3）对序列进行零均值化,对序列进行零均值化，得到新序列,=-0.11667，3.88333，-8.11667，3.88333，1.38333，-3.11667，1.38333，-0.11667， -0.11667，-0.11667，-0.11667，-0.11667， -0.11667，-0.11667，-0.11667，-0.11667， -0.11667，-0.11667，6.78333，-1.

17、91667， 0.18333，2.38333，-3.21667，8.48333， -13.51667，-0.11667，-0.11667，14.08333， -5.01667，-5.91667,（4）对序列求样本自协方差函数与样本偏自相关函数,计算样本自相关函数,样本自协方差函数估计,估计样本偏自相关函数,具有截尾性，,用AR（3）模型拟合序列,即用ARIMA（3，1，0）模型拟合原序列。进行残差检验，得到,拟合检验统计量的概率P值都显著大于显著性检验水平0.05，可认为该残差序列为白噪声序列，系数显著性检验显示三个参数均显著。从而ARIMA（3，1，0）模型对该序列建模成功。,（5）模型参

18、数估计,得到与上述参数显著性检验一样的结果：,= -3.16，,= -2.75，,= -3.30，,因此ARIMA（3，1，0）模型即为：,注：利用同样的方法可以建立预测干流中其他两类水、全流域和支流中的三类水所占比例的时间序列分析模型。,4、模型预测,利用上述模型，预测干流中劣类水未来10年所占比例，得到：,5、结果分析,从预测结果中可以看出，干流中污水和劣V类水所占的比例只有微小的增长，支流中劣V类水的比例增长速度较快。全流域中劣V类水所占比例增长速度也较快。尽管干流中和全流域中污水所占比例增长并不大，但长期发展下去，全流域和支流中可饮用水的比例将低于50%，而在干流中可饮用水比例也仅仅是

19、略高于50%，若不采取措施防污治污，后果不堪设想！,在上述模型预测结果中，我们得到的数据为枯水期、丰水期和8-12月的平均值，并不包含水文年的数据，故还需要还原水文年的数据，可以通过公式：水文年=（枯水期+丰水期+8-12月平均值）/3 对于三类水所占的比例满足：饮用水+污水+劣V类水=100%. 具体预测结果见附录4。,6、模型评价与改进,在题目中仅仅给出了10年水文年的观测数据，要用来预测后10年的数据，数据量太小。虽经数据处理，将数据合理地增加到30个，但是对于利用时间序列分析模型进行短期的预测，数据量仍显得太少，这样难免导致数据的预测误差较大。但就本题目而言，我们还是得到了较为满意的结果。,事实上，我们还可对数据进一步进行处理，以增加数据量，提高预测的精度。对上述的原始序列，我们可在保证序列的平稳性的条件下，进行平滑技术处理：,然后与原始序列融合得到一个新的时间序列，新序列的时期长度将接近于原始序列的两倍，数据个数大大增多，关键是可以降低预测的误差。,附录1：附表: 地表水环境质量标准（GB38382002）中4个主要项目标准限值单位：mg/L,附录2：1995年-2004年长江流域水质报告【干流劣V类】,附录3：干流中劣V类水所占比例（1/100）,附录4：20052014年的预测数据（1/100）【干流劣V类水】,

展开阅读全文