随机数据建模经验模型分布检验与预测.ppt

资源描述

《随机数据建模经验模型分布检验与预测.ppt》由会员分享，可在线阅读，更多相关《随机数据建模经验模型分布检验与预测.ppt（50页珍藏版）》请在三一文库上搜索。

1、2019/3/2,1,随机数据建模, 经验模型基于要素分解的时间序列预测分布检验,2019/3/2,2,一、经验模型,在建立数学模型的过程中，经常需要建立变量之间的关系，但往往由于对研究对象的内部机理不甚了解，不能通过合理的假设，或根据物理定律、原理，经过机理分析法而得到。,可借助于由实验或测量得到的一批离散数据，通过对数据充分观察和分析，获得数据所含信息，揭示变量间的内在联系，并选择适当的数学式对变量间的关系进行拟合，建立经验模型，或者进行数据曲线拟合。,2019/3/2,3,寻找或选择适当的函数拟合变量之间的关系（函数关系或回归关系）是重要的环节。,1）绘制数据散布图（或连线图）

2、； 2）分析数据散布图（或连线图）； 3）选择函数关系形式。,一般步骤,通过分析数据散布图可以获得对变量间关系的感性认识，形成初步的看法，以便于对问题做进一步的分析。,2019/3/2,4,分析数据散布图,分析数据散布图，可得出变量的关系是：线性的还是非线性的？有无周期？呈现何种变化趋势？变化率如何,例1 建立一个简洁的函数关系式来描述某个地区人的身高和体重的对应关系，数据见表7.4（p156）。曲线特征：体重W 随身高H 的增长而单调增长，但可以观察到是非线性增长。,2019/3/2,5,2019/3/2,6,选择函数关系形式,形式尽可能简洁，尽可能线性化；依据实际问题的精度要求

3、，合乎实际规律。,原则,续例1 选择幂函数 W= cHa , 描述身高体重关系，有何优点？,优点：此函数可以线性化。,如何线性化？,2019/3/2,7,两边取对数，有,令,变换为线性函数 y= ax + b,W= cHa,2019/3/2,8,例2 描述氮肥施肥量与土豆产量间的变量关系可选二次函数 y=b0 + b1 x +b2 x2,注：其中 b0= y(0) = 15.18,2019/3/2,9,可选择威布尔模型：,也可以选择S函数：,合理性如何？哪个模型更好？,关于磷肥施肥量和土豆产量的变量关系：,2019/3/2,10,合理性分析,初值极限趋势,优点分析：S 模型

4、所含参数更少，另外若令,可得线性模型,威布尔模型,S函数,思考：威布尔模型有无优点？,2019/3/2,11,二、模型的参数估计,数学建模的一个重要工作是建立变量间的数学关系式，但公式中几乎总是涉及一些参数。,求模型中参数的估计值有三种常用方法：图解法、统计法、机理分析法,1图解法,对经验模型的精度要求不高，只需对参数做出粗略估计时可采用图解法。,2019/3/2,12,关于磷肥施肥量和土豆产量的变量关系：,威布尔模型:,观察图发现数据点都位于直线 y=43的下方，并且数据点越来越靠近这条直线，可以估计A=43 。,如何估计B、K ？,2019/3/2,13,例3 （见P158例7.2.1）

5、表中给出了12月1日（星期二）和12月2日（星期三）两天内的海浪潮高度值（相对于海堤上的零标尺记号，以米为单位）。我们能依据此表来预测12月5日（星期六）下午1：00的海浪高度值吗？,2019/3/2,14,分析：根据对数据散布图的分析，采用函数 x(t)=asinb(tt*)，其中x(t* )=0 （1）,或采用函数,x(t)=asin(bt)+ccos(bt) （2）,需估计振幅 a 和频率b,解决方法：直接量出高低浪之间的高度差为6.6米，,（米）,2019/3/2,15,量出海浪变化周期约为12.3小时,（每小时）,得经验模型 x(t)=3.3sin0.511(tt*) t

6、0。,将频率的估计代入（2）式，有,x(t)=asin(0.511t)+ccos(0.511t),代入x(0)=c=2.4 及 x(23)=3.6,得关于海浪潮随时间变化的另一经验模型,x(t)=2.4cos(0.511t)2.7sin(0.511t)， t0。,2019/3/2,16,模型应用,预测12月5日下午1:00的海浪潮高度为,x(109) = 2.4cos(5.11109) 2.7sin(5.11109) =2.4cos(55.7)2.7sin(55.7) =2.4cos(5.4302.7sin(55.7)3.6(米),误差分析：这一时刻潮位的实际观察值为4.1米，相对误差大约是1

7、2%,请考虑一下成因。,2019/3/2,17,思考：仔细分析图，可发觉图中 (1 ) x=0似乎不是海浪高低潮位的中值; (2) 振幅随时间的延续似乎在轻微地增大。我们怎样考虑这些细节来修改模型，以获得更准确的预报呢？,2019/3/2,18,2. 统计法,参数估计的统计处理，往往运用最小二乘法估计。原理在概率论与数理统计中已有详细介绍，这里略。,特点：统计分析法应用于变量间存在相关关系的情形，并且需要较多数据为基础。,2019/3/2,19,例3 磷施肥量和土豆产量的回归函数选为,令,对数据进行相应变换，可估计出,x0,分析：有，与目测法的结论惊人一致。,2019/3/2,20,

8、三、时间序列预测,1、时间序列的成分一个时间序列中往往由几种成分组成，通常假定是四种独立的成分趋势、循环、季节和不规则。,2019/3/2,21,1.1 趋势成分,在一段较长的时间内，时间序列往往呈现逐渐增加或减少的总体趋势。时间序列逐渐转变的性态称为时间序列的趋势。趋势通常是长期因素影响的结果，如人口总量的变化、方法的变化等等,趋势成分,时间序列的长期动向,长期影响因素,2019/3/2,22,1.2 循环成分,时间序列常常呈现环绕趋势线上、下的波动。任何时间间隔超过一年的，环绕趋势线的上、下波动，都可归结为时间序列的循环成分。,趋势成分,围绕长期趋势线的上下波动,例如经济危机

9、,2019/3/2,23,1.3 季节成分,许多时间序列往往显示出在一年内有规则的运动，这通常由季节因素引起，因此称为季节成分。,季节成分,季节因素引起的一年内有规则的运动,例如，一个衬衣制造商在秋季和冬季各月有较低的销售活动，而在春季和夏季各月有较高的销售量。防寒衣物的制造商的销售却正好相反。,2019/3/2,24,季节成分也可用来描述任何持续时间小于一年的、有规则的、重复的运动。例如，每天的交通流量资料显示在一天内的“季节”情况，在上、下班拥挤时刻出现高峰，在一天的休息时刻和傍晚出现中等流量，在午夜到清晨出现小流量。,季节成分的扩展,2019/3/2,25,1.4 不规则成分,时间

10、序列的不规则成分是剩余的因素，它用来说明在分离了趋势、循环和季节成分后，时间序列值的偏差。不规则成分是由那些影响时间序列的短期的、不可预期的和不重复出现的因素引起的。它是随机的、无法预测的。,不规则成分,短期的，不可预期和不重复出现的因素引起的随机变动,2019/3/2,26,时间序列,不规则成分,分离出趋势成分,分离出循环成分,分离出季节成分,2019/3/2,27,商业和经济中的许多情形是一期与一期的比较。例如，我们想研究和了解失业人数是否比上个月上升1%，钢产量是否比上个月上升5%等问题。在使用这些资料时，必须十分小心。因为每当描述季节影响时，这样的比较会使人产生误解

11、。例如，9月份电能消费量比8月份下降3%，可能仅仅是由于空调使用减少这一季节影响引起的，而不是因为长期用电量的减少。事实上，在调整季节影响后，我们甚至可能发现用电量是增加的。,2019/3/2,28,时间序列一般有两种的模型：乘法模型和加法模型。乘法模型：加法模型：,上式中：Y 时间序列的数值 T 趋势成分 S 季节成分 I 不规则成分,2019/3/2,29,2、时间序列的预测,2.1 移动平均法移动平均法是用一组最近的实际数据值来预测时间序列未来值的一种常用方法。它是采用逐项递移的办法分别计算一系列移动的序时平均数形成一个新的派生序时平均数时间数列。在这个派生的时间数列中，短期的

12、偶然因素引起的变动被削弱，从而呈现出现象在较长时间的基本发展趋势。根据预测时使用的各元素的权重不同，可以分为简单移动平均和加权移动平均。,2019/3/2,30,简单移动平均法,将最近的N期数据加以平均，作为下一期的预测值。当时间序列的变动趋势为线性时，可以用简单移动平均法进行分析。简单移动平均法对各元素给的权重都相等。计算公式如下,式中， N 为期数； At-j+1 为t-j+1期的实际值； Mt+1为t+1期的预测值。,2019/3/2,31,图某公司销售量移动平均趋势值和移动平均趋势图,分析：图形和表格有何特点？,2019/3/2,32,分析结论如下：从图中观察到，3年移动平均

13、趋势值放在第二项对应的位置上，7年移动平均趋势值放在第4项对应的位置上。同时，看到7年移动平均序列比3年移动平均序列表现的趋势更明显，这是因为它的移动间隔更长。移动间隔越长，可以得到的移动平均值越少，因此，长于7年的移动间隔通常是不可取的，因为在序列的前几项和后几项将失去太多的移动平均值，这可能导致脱离现象发展的真实趋势。,2019/3/2,33,加权移动平均法,加权移动平均的原理是，时间序列过去各期的数据信息对预测未来趋势值的作用是不一样的。除了以N为周期的周期性变化外，远离预测期的观测值的影响力相对较低，故应给予较低的权重。计算公式如下,式中， N 为期数； At-j+1 为t-j+1

14、期的实际值； Mt+1为t+1期的预测值; j为第t-j+1期实际值的权重，且 j =1。,2019/3/2,34,权重的选择一般而言，最近期的数据最能预示未来的情况，因而权重应大些；但是，如果数据是季节性的，则权重也应是季节性的。存在的一些问题加大移动平均法的期数（即加大N值）会使平滑波动效果更好，但会使预测值对时间序列数据的实际变动更不敏感；移动平均值并不总是很好地反映出趋势，由于是平均值，预测值总是停留在过去的水平上，从而不能预测将来的波动性；移动平均法还需要有大量过去数据的记录，如果缺少历史数据，移动平均法就无法使用。,2019/3/2,35,指数平滑法,指数平滑法通过对

15、历史时间数列进行逐层平滑计算，从而消除随机因素的影响，识别经济现象基本变化趋势，并以此预测未来。简单移动平均法是对时间序列过去的近期数据加以同等利用，但不考虑较远期的数据；加权移动平均法给予近期观测值更大的权重；而指数平滑法则不舍弃过去的观测值，但是仅给予逐渐减弱的影响程度，即随着观测期的远离，赋予逐渐收敛为零的权数。,2019/3/2,36,式中， St为时间t的平滑值； Yt-1为时间t-1的实际值； St-1为时间t-1的预测值； a为平滑常数，取值范围为0,1；,指数平滑法的基本公式是：,2019/3/2,37,常数a取值至关重要平滑常数决定了平滑水平以及对预测值与实际结果之间

16、差异的响应速度。平滑常数越接近于1，远期实际值对本期平滑值的下降越迅速；平滑常数越接近于0，远期实际值对本期平滑值影响程度的下降越缓慢。当时间序列相对平稳时，可取较大的；当时间序列波动较大时，应取较小的，以不忽略远期实际值的影响。,2019/3/2,38,图汽车租赁需求量预测值,2019/3/2,39,2.2 基于要素分解的时间序列预测,时间序列一般有两种的模型：乘法模型和加法模型。乘法模型：加法模型：,上式中：Y 时间序列的数值 T 趋势成分 S 季节成分 I 不规则成分,2019/3/2,40,例下述资料是某公司在过去4年中台式电脑的销售量（单位：千台）数据。,2019/3/2,

17、41,计算中心化移动平均数,2019/3/2,42,计算季节不规则值,2019/3/2,43,计算季节指数,2019/3/2,44,消除时间序列的季节影响,2019/3/2,45,进行趋势预测,Tt=b0+b1t 式中 Ttt期台式电脑销售量的趋势值； b0趋势线的截距； b1趋势线的斜率；,2019/3/2,46,利用消除季节影响的时间序列确定趋势,计算b0和b1的公式如下,2019/3/2,47,计算结果：,2019/3/2,48,Tt=5.101+0.148t,因此，时间序列的线性趋势成分的表达式为：,由趋势方程可分别产生第17、18、19和20季度的台式电脑销售量预测值为7617，7765，7913和8016台。,2019/3/2,49,季节调整,表11-7 台式电脑销售量时间数列的季度预测值,2019/3/2,50,

展开阅读全文