试验一-基于AR模型的股票价格预测.doc

上传人:scccc 文档编号:12531156 上传时间:2021-12-04 格式:DOC 页数:19 大小:385.50KB
返回 下载 相关 举报
试验一-基于AR模型的股票价格预测.doc_第1页
第1页 / 共19页
试验一-基于AR模型的股票价格预测.doc_第2页
第2页 / 共19页
试验一-基于AR模型的股票价格预测.doc_第3页
第3页 / 共19页
试验一-基于AR模型的股票价格预测.doc_第4页
第4页 / 共19页
试验一-基于AR模型的股票价格预测.doc_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《试验一-基于AR模型的股票价格预测.doc》由会员分享,可在线阅读,更多相关《试验一-基于AR模型的股票价格预测.doc(19页珍藏版)》请在三一文库上搜索。

1、实验一-基于AR模型的股票价格 预测基于AR模型的股票价格预测1问题描述AR模型是一种线性预测,即已知N个数据,可由模型推出第N点前面或后面的数据(设 推出P点),所以其本质类似于插值,其目的都是为了增加有效数据。本次实验使用从雅虎上 下载的美国某股票七年共2000个收盘价格数据来进行数据分析建模, 取其前1000个价格数据 构建预测方程,预测剩下的股票收盘价格。2. 原理简述2.1基本原理自回归模型(Autoregressive Model,AR Model )是用自身做回归变量的过程,即利用前 期若干时刻的随机变量的线性组合来描述以后某时刻随机变量的线性回归模型,它是时间序列中的一种常见形

2、式。考虑一组随机自变量观测值与因变量观测值之间的关系,设自变量观测值为x(n),因变量观测值为丫=y(n),y(n-1),y(n-N),则依据AR Model,满足如下关系式:a0y n ay n 1aNy nN x n(2.1)第7页共15页其中,a=ao,a1,aN为各项因变量观测值系数。通常情况下,我们令ao=1。考虑到式(2.1)的迭代性,我们可以将其转化为一组自变量观测值和一个因变量观测值的形式如下:yn xn /n12xn2(2.2)其中,A= 1, 2,是各项自变量观测值的系数。另外,我们假定自变量观测值的自相关函数为:(2.3)k是狄拉克函数其中,2是自变量观测值的方差,将所得

3、的y(n)代入可得:E y n x nE x nM n 12(2.4)同样,将任意的一个y(n-K)代入可得:E y n k x n 2 k接下来,我们将所得各式写成向量的形式如下:(2.5)a1yn,yn 1,.,y n N M XnaN1aiEynxn Eyn yn,yn1 ,., y nN 抽(2.6)Eyn k x n6 r1 ,,rNa1MaN,y n,ya1MaN(2.7)a11,rk N0MaNr°1LN 1ar1r1roLrN 2a2DMMMMMMN 1N 2LroaNrN该矩阵由Yule-Walker方程描述为:Rar。将因变量观测值的自相关函数写成矩阵形式可得如下

4、:对于该系统预测的关键在于对系统系数向量(2.8)a的求解。将ARModel方程写成如下形式:Ny naky n k x nk 1(2.9)将因变量观测值y(n)的L个观测值写成矩阵形式如下:y Ny N 1 y N 2y N 1y N y N 1MMMy L 1y L 2 L将上式写成Yule-Walker方程形式为:yLy 0ax NLy 1a2x N 1(2.10)MMMMLy L N 1aNx L 1Ya x。其中,x是自变量观测值矩阵,a是系数矩阵,丫是Toeplitz矩阵,y是因变量观测值矩阵。.2h使用最小二乘法(Least Square,LS)寻找一个最优解为:|x y Ya

5、y Ya。对该1式进行求解可得:aYhY YHy。将所求系数代入即可得到拟合方程,根据拟合方程可以得到问题的估计值2.2实现步骤具体实现步骤如下:(1) 利用自变量观测值x,因变量观测值y和系数矩阵a构建系统模型y Ya x ;1(2) 依据LS求解系统系数矩阵aYhY YHy ;(3)将a代入构造预测方程;(4)将已知值代入到预测方程中对未知值进行预测。2.3实现框图构建系统模型1r依据LS求解系统系数矩阵构造预1则方程1r利用已知值对未知值进行预测图1预测实现框图3. 仿真结果及分析仿真分为三组进行,分别是固定系数矩阵 a的股价预测图样;迭代更新系数矩阵 a的股价 预测图样;加窗更新系数矩

6、阵 a的股价预测图样。3.1固定系数矩阵a的股价预测仿真采用1000个股票收盘价格构建预测方程,来预测接下来300个股票收盘价格,具体仿真如下图所示:(a)实际值预测值格价盘收票股280026002400实际值预测值格价盘收票股40'120200601008002OO8t)2O602180160o O o O4 2格价盘收票股u A'i,/(b)实际值 预测值I9280026002400实际值预测值格价盘收票股第18页共15页图2固定系数矩阵时不同阶数下股票价格预测图图2所示为利用前1000个数据求得系数矩阵a之后对接下来300个股票价格的预测图,蓝色为股票价格实际值,红色为股

7、票价格预测值。图中(a)、(b)、( c)、( d)分别代表阶数为10、50、100、200时的不同情况。从图中可以看出,在阶数为 10时,股票价格预测效 果较差;当阶数为50和100时,预测效果有较大提升;而在阶数为 200时,出现过度拟合的 情况,预测效果开始下降。四种不同阶数的预测均方误差如表I所示:表I不同阶数下股票价格预测均方误差10501005.73281.65523.8745阶数均方误差(104)6.0020从表I中可以看出,阶数位于10100之间时,具有最优预测。3.2迭代更新系数矩阵a的股价预测本节中,我们利用原始数据求解系统系数矩阵 a,利用该系数矩阵a构建预测方程,通过

8、预测方程求解接下来的一个值,再将该值代入,更新系数矩阵 a,实现一种交叉迭代的预测求 解。仿真采用1000个股票收盘价格构建预测方程,来预测接下来 1000个股票收盘价格,具体 仿真如下图所示:300028003000280000620024格价盘收票股002200实际值预测值602 O642O864 O40'20022o O o OO 82 1o O o O6 4格价盘收票股实际值 预测值002O40006008008642O0062002400230002800004o o o O o o o O 2 0 8 62 2 11格价盘收票股$I S4.(a)b)实际值预测值3000一,

9、实际值预测值1000 IIIIIIIIII0200400600800100012001400160018002000数据量28001000 IIIIIIIIII0200400600800100012001400160018002000数据量(C)(d)图3迭代更新系数矩阵时不同阶数下股票价格预测图图3中(a)、( b)、( c)、( d)分别为阶数取10、50、100和200时的股票价格预测 图,从图中可以看出,由于对系数矩阵 a进行不断的迭代更新,因此求得的预测值近似为线性 预测,即只能预测股票的升降趋势。观察之前1000个数据可知,股票价格以下降趋势为主,因此在这里的预测函数为一近似单调递

10、减的线性函数。3.3加窗更新系数矩阵a的股价预测考虑到3.2中系数矩阵a是在每次得到新的预测值就进行更新,在本节中,我们利用前1000 个股价预测接下来长度为 m的股价,m即为我们加窗的长度。在这里我们取m为一系列的值,分别为50、100、200、300和400。通过预测的估计,更新系统矩阵 a,进而预测接下来的股 价。仿真时阶数分别取为100和300,显示如下图所示:28002600实际值预测值2800|实际*值2600 .预测值10000200400600 800数据量100012001400200400600800数据量100012001400(a)( b)图4加窗长度为50时不同阶数下

11、的股价预测图格价盘收票股-0.50200400600 800数据量x 1028实际值预测值1000 120076543210-114000200400600800100012001400数据量a实际值预测值(b)图5加窗长度为100时不同阶数下的股价预测图格价盘收票股10数据量I 00U实际值 预测值(b)图6加窗长度为200时不同阶数下的股价预测图00实际值预测值格价盘收票股008200400210000200400600 800数据量1000120014000Q62006格价盘收票股1000a)(b)图7加窗长度为300时不同阶数下的股价预测图0082100001000o O602 2O4

12、0210001000数据量;实际值预测值o o o O o o o O 2 0 8 62 2 11格价盘收票股数据量(a)(b)图8加窗长度为400时不同阶数下的股价预测图观察以上各图可知,加窗长度为 100、200和300时,预测值和实际值具有较大偏差。而 当加窗长度为50和400时,效果较之前三种有较大提高。其中当阶数为100时,预测结果近似于线性,当阶数为300时,两者均具有较好的预测。其中,加窗长度为50时,具有最佳预测效果。从以上仿真结果可以看出,预测准确性和加窗长度和阶数有关。所以,为了获得较好的预 测效果,需要选择合适的加窗长度和阶数。4. 结束语本次实验是基于AR模型的股票价格

13、预测,在实验中我们使用Yule-Walker方程对系统系 数矩阵a进行求解,通过求解得到的系数矩阵 a构造预测方程。同时,在仿真中我们讨论了使 用不同的方法对系数矩阵a进行优化,分别为固定系数矩阵a的股价预测;迭代更新系数矩阵 a的股价预测;加窗更新系数矩阵a的股价预测。实验结果表明,在固定系数矩阵a的情况下, 预测的准确性和阶数的选取有关; 而在更新系数矩阵a的情况下,预测的准确性和加窗长度及 阶数均有关。5. 附录股票价格数据命名为 XX ' o%不更新A值clcclearload ('xx.mat'); data = xx(:,1)' p = 200;L

14、= 1000; MSE = 0;datal = data(1:L);y = data(p+1:L): for i = 1:pY(:,p-i+1) = data(i:L-p+i-1): enda = -i nv(Y'*Y)*Y '*y;for i = L+1:le ngth(data)data1(i) = data1(i-p:i-1)*(-a);endfor i = 1000:1300MSE = MSE+(data(i)-data1 (i) )A2;endMSE = MSE/300;figure(1) plot(data(1:1500),'b');hold on

15、plot(data1(1:1500),'r'); xlabel('数据量');ylabel('股票收盘价格'); legend('实际值预测值');axis(0 1300 1000 2800);%每次预测一个点,代入更新a值 clcclear all load ('xx.mat'); data = xx(:,1)' p = 200;L = 1000;data1 = data(1:L);for i = L+1:le ngth(data)y = data1(p+1:L)'for j = 1:pfor k

16、 = 1:(L-p)Y (k,j) = data1(p-j+1+k-1);endendY1 = Y:K = in v( Y1*Y);a = -inv(Y 1* Y)*Y 1*y; data1(i) = data1(i-1:-1:i-p)*(-a);endfigure(2)plot(data(1:2000),'b');hold onplot(data1(1:2000),'r');xlabel('数据量');ylabel('股票收盘价格');lege nd('实际值预测值');%加窗的预测,窗的长度分别为100、200

17、、300、400、500clcclearload ('xx.mat');data = xx(:,1)'p = 300;L = 1000;L_list = 50 100 200 300 400;select_ nu mber = 5;data1 = data(1:L);for i = 0:30ydata1(L_list(select_ number)*i+(p+1):L_list(select_ numb er)*i+L)'for j = 1:pfor k = 1:(L-p)Y (k,j) = data1(L_list(1)*i+p-j+1+k-1);endend

18、%a(:,i+1) = -in v( Y'* Y)*Y '*y;a = -i nv(Y'*Y )* Y'*y;for m = 1:L_list(select_ number)data1(L+L_list(select_ nu mber)*i+m) data1(L+L list(select nu mber)*i+m-1:-1:L+L_list(select_ nu mber)*i+m-p)*(-a); endendfigure(3) plot(data(1:1400),'b');hold on plot(data1(1:1400),'r'); xlabel('数据量');ylabel('股票收盘价格'); legend('实际值','预测值');第15页共15页

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1