毕业设计(论文)-回归分析在股票预测中的应用.doc

上传人:小小飞 文档编号:3282430 上传时间:2019-08-07 格式:DOC 页数:44 大小:891.02KB
返回 下载 相关 举报
毕业设计(论文)-回归分析在股票预测中的应用.doc_第1页
第1页 / 共44页
毕业设计(论文)-回归分析在股票预测中的应用.doc_第2页
第2页 / 共44页
毕业设计(论文)-回归分析在股票预测中的应用.doc_第3页
第3页 / 共44页
毕业设计(论文)-回归分析在股票预测中的应用.doc_第4页
第4页 / 共44页
毕业设计(论文)-回归分析在股票预测中的应用.doc_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《毕业设计(论文)-回归分析在股票预测中的应用.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)-回归分析在股票预测中的应用.doc(44页珍藏版)》请在三一文库上搜索。

1、成都理工大学毕业设计(论文) I 回归分析在股票预测中的应用 作者姓名: 专业班级:应用数学 2005070101 指导老师: 摘 要 回归分析预测被广泛应用于经济学、社会科学、工程技术和生物学等许多 领域当中,进行各专业指标变量的统计分析和预测控制。本文从回归分析预测 与其他预测方法的简单算法对比出发,系统的讨论了线性回归分析和非线性回 归分析的基本算法,再以八一钢铁股票的历史价格为例,对比多元线性回归和 非线性回归分析预测,得出非线性回归分析拟合能力更强、拟合优度更高的结 论。 关键字:回归分析预测;非线性回归;线性回归;拟合度 成都理工大学毕业设计(论文) II Regression a

2、nalysis in the stock of the use of forecast Abstract: The regression analysis forecast is widely applied in the economic, the social sciences, the engineering technology and the biology and so on the middle of many domains, carries on each specialized target variable the statistical analysis and the

3、 predictive control. This article embarks from the regression analysis forecast with other forecast techniques simple algorithm contrast, systems discussion linear regression analysis and non-linear regression analysiss primary algorithm, again take 81 steel and iron stocks historical price as the e

4、xample, the contrast multi-dimensional linear regression and the non-linear regression analysis predict that obtained the non-linear regression analysis fitting ability to be stronger, a goodness of fit higher conclusion. Keywords: Forecast regression analysis,Non-linear regression,Linear regression

5、,Fit 成都理工大学毕业设计(论文) III 目 录 第 1 章 前 言1 1.1 选题背景和意义1 1.2 股票的可预测性2 1.3 回归的发展概况3 1.4 文章结构4 第 2 章 预测方法概述6 2.1 趋势分析法6 2.2 时间序列法7 2.3 灰色预测法7 2.4 模糊数学法8 2.5 回归分析法9 第 3 章 回归分析10 3.1 线性回归分析11 3.1.1 一元回归模型.11 3.1.2 多元回归线性分析模型.12 3.1.3 线性相关程度测定及相关性检验预测.16 3.2 非线性回归分析17 3.2.1 非线性回归分析.17 3.2.2 参数估计和模型检验.19 3.2.3

6、 非线性回归分析存在的问题.21 第 4 章 实例分析23 4.1 用回归分析进行预测的步骤23 4.2 数据的选取23 4.3 线性回归分析的程序实现24 4.3.1 回归方程求解.24 4.3.2 运行结果.26 成都理工大学毕业设计(论文) IV 4.3.2 模型预测.27 3.3.3 结果分析.27 4.4 非线性回归分析的程序实现27 4.4.1 模型拟合.29 4.4.2 差分运算.29 4.4.3 模型定阶.31 4.4.4 建立模型.31 4.4.5 模型检验.31 4.4.6 模型预测.32 4.4.7 绘图.32 4.4.8 结果分析.33 结 论34 致 谢35 参考文献

7、36 附 件37 成都理工大学毕业设计(论文) 1 第 1 章 前 言 1.1 选题背景和意义 股票价格是中国绝大多数公民关心的问题,也是经济、系统科学领域研究 的热点问题。 目前,证券市场的成熟程度己经成为衡量一个国家经济总体发展水平的重 要指标。西方发达国家证券化比率(股票市场总市值占 GDP 的比重)高达 50%- 100%。新中国的证券市场虽然起步较晚,但有了较快发展,主要表现在股票市 场的总市值和上市公司数目的不断增长。我国加入 WTO,所有经济元素都在向 国际看齐,诸如法律法规,关税水平等。但随着贸易制度的完善,股市作为经 济的“晴雨表”与国际接轨,逐步走向成熟、规范是必然趋势。随

8、着国家对证 券市场的开放,政策调控水平以及投资集团群体思维能力的提高,人们在交易 行动之前对证券市场的未来加以预测也会成为一种自觉的思维活动。 投资者们时刻在关心股市、分析股市、试图预测股市的发展趋势,然而影 响股票价格的因素很多,其作用机制也相当复杂,其走势的预测非常困难。主 要因为我们缺乏信息对市场影响的传导系统的结构和系统模型,并且不能准确 把握金融政策、利率政策、公司状况、国际市场及投资者心理承受能力等因素 的变化及其对市场的影响方式和作用。因此,对我国证券投资预测的研究,不 仅可以使投资者获得风险既定下的最大收益或收益最大下的最小风险,而且对 研究证券价格的形成机制、评价证券市场效率

9、以及对证券市场实施有效监管都 具有重要作用。也正因为如此,如何判断或预测股票市场价格走势引起了众多 经济金融学家和市场分析人员的极大兴趣,各种预测方法相继涌现,证券投资 领域可以说是研究和运用各种预测方法最多的领域之一。 股市预测是经济预测的一个分支,它是以准确的调查统计资料和股市信息 为依据,从股票市场的历史现状和规律性出发,运用科学的方法,对股票市场 的未来发展前景做出测定。 股市的可预测性问题与有效市场假说(三 ffieientMarketHypothesis,简 称 EMH)密切相关。如果有效市场理论或有效市场假说成立,股票价格充分反映 了所有相关的信息,价格变化服从随机游走,股票价格

10、的预测则毫无意义。从 成都理工大学毕业设计(论文) 2 中国股票市场的特征来看,大多数学者的结论支持中国的股票市场尚未达到弱 势有效,也就是说,中国股票市场的股票价格时间序列并非序列无关,而是序 列相关的,即历史数据对股票的价格形成起作用,因此,可以通过对历史信息 的分析预测价格。 随着计算机技术、混沌、分形理论的发展,人们开始将股票的市场行为纳 入非线性动力学研究范畴。我国学者闰冀楠、张维和美国学者 AF.Darart 和 MZhong 等分别采用非参数检验等方法,发现我国股市的指数收益中,存在经典 线性相关之外的非线性相关,从而拒绝了随机游走的假设,指出股价的波动不 是完全随机的,它貌似随

11、机、杂乱,但在其复杂表面的背后,却隐藏着确定性 的机制,因此存在可预测成分。当然,认为股价可预测,并不等于说可以 100% 的准确预见,而是指可以使用经济预测的方法,建立起能在一定误差要求之下 的预测股价变动的预测模型。 一批学者先后证实了证券市场的确存在着一些可利用的规律,其成功率之 高和稳定性之久,远远超出了“随机行走理论”可以解释的范围,因此,最近二 十年,持证券市场缺乏效率观点人越来越多,证券市场预测的研究也再次成为 人们关注的热点,应用技术分析等方法进行证券投资预测分析研究中逐渐成为 证券投资的主要手段之一1。 1.2 股票的可预测性 通过对已知事实的分析总结,得到对客观世界的认识和

12、规律。这些规律可 以帮助人类认识现有的世界,同时帮助人类对未知的现象做出正确的预测和判 断,预测不能直接观测的事实。预测是指从已知事件测定未知事件。预测理论 作为一种通用的方法论,既可以应用于研究自然现象,也可以应用于研究社会 现象。将预测理论应用于各个领域,就产生了预测的各个分支,如医学预测、 电力预测、经济预测、气象预测等等。 在金融经济学的发展上,人们对金融预测作了大量的探索,取得了丰硕的 成果。典型的金融预测是回归分析预测。回归分析预测就是在大量观测数据的 基础上,找出这些变量之间的内部规律,从而定量的建立起一个变量与其它变 量的数学表达式。为了研究这种规律性,人们提出了许多预测模型,

13、并对这模 型的性质及分析方法进行了深入的研究2。 成都理工大学毕业设计(论文) 3 这些在理论上很成功,但它们都是建立在很理想的假设上,而这些假设与 市场的实际情况有很大差距,所以这些理论在实际效果中并不理想。另一种方 法是从统计角度对金融时间序列进行研究。这种方法直接从实际数据出发,应 用概率统计推断出市场未来的变化规律。虽然这种方法从经济学角度来讲缺乏 理论性,但是在实际应用中效果较好。而且,统计方法还可以对经济模型的好 坏进行检验和评价。 股市预测,是金融经济预测的一个重要分支。它对股票市场所反映的各种 资讯进行收集、整理、综合等工作,从股市的历史、现状和规律性出发,运用 科学的方法,对

14、股市未来发展前景进行测定11。 1.3 回归的发展概况 回归分析方法通常分为线性和非线性回归方法两大类,其中线性回归方法 己经发展成为数理统计学的一个相对成熟的重要分支之一,并被广泛应用于经 济学、社会科学、工程技术和生物学等许多领域当中,进行各专业指标变量的 统计分析和预测控制,并取得可喜成绩。随着回归分析方法研究的逐步深入以 及具体实践遇到的大量复杂的非线性问题,在线性统计的基础上,非线性回归 分析研究也逐渐发展起来并成为处理非线性问题的主要手段之一,起到传统线 性回归方法不可替代的重要作用。 统计学理论的预测方法,主要是基于模型拟合和最小二乘原理建立各种回 归、自回归、混合回归模型进行预

15、测。此类方法,具有严格的数学基础,应用 也最广泛,近年也有相当的发展。 如 Nelder,JA 和城 dderburn,RwM 提出了广义线性模型13,它放松 了经典线性模型的假设,极大地丰富了回归分析的理论。Aarno,Li 和 Duan 对 假设进一步放松,提出了一般回归模型,该领域研究具有十分惊人的前景,但 由于其仅能辨识参数的方向,应用起来十分不便,仅能对建模提供指导。在计 量经济研究中,Ichimura 则提出了一类十分重要的模型一单指标模型。研究的 重点在于使之更适合于实际社会经济系统建模。 非参数建模,数据驱动式建模所考虑的重要问题是,在事先对模型完全不 了解的情况下,如何提出一

16、个适当的模型。这方面研究的一个重要论题是非参 数建模。Friedman 和 Stuetzle 提出了 pp 回归模型;Breioan 和 Friedman 提出 成都理工大学毕业设计(论文) 4 了建模的 ACE 方法,Hastie 和 TibS 于 lirani 提出了广义加性模型; Buja,Hastie 和 Tibshiran 对加性建模进行了全面的评述与讨论;Breiman 提出 了高维数据建模的 MARS 方法。它们共同的特点是模型形式灵活,建模过程涉及 很少假定。但计算量大,解释困难,在指导变量选择及模型设定方面深入的研 究是必不可少的。 至于估计问题,NL2SLS(非线性二阶段最

17、小二乘)、NL3SLS(非线性三阶段最 小二乘)和 NLFIML(NLLIML)(非线性完全(有限)信息极大似然)估计方法是通常 采用的方法,AmemiyA 和 Gallani 均给予了总结与评述14。解决的关键在于 辅助变量的选取,另外,有效初始点设置及考虑全局最小参数估计一方法的研 究也是值得考虑的。 1.4 文章结构 首先介绍论文研究背景和研究的可行性,并讨论了回归的简单发展。股票 预测已成为越来越多的股民和学者关注的问题,股票理论的可预测性被越来愈 多的人认可。回归分析和非线性回归分析已越来越广泛的使用于股票研究中, 进行不断的研究和改善,意图得到更稳定更符合规律的算法结构。 其次对各

18、种预测方法进行了简单的概述介绍。包括理论定义和基本算法, 并简单阐述了各种预测方法的优缺点。可以看到各种方法都有它的优缺点和需 要注重改善的地方。各种预测方法的对比中,可以发现回归分析预测有操作简 单,容易理解等方面的优点,但也有选不准自变量的困扰。 再次仔细介绍了回归分析的两部分,线性回归分析和非线性回归分析算法 的算法结构步骤和具体算法,从最基本的一元线性回归分析着手,介绍与一元 线性回归分析算法相似度跟高的多元线性回归,并进一步的引出非线性回归分 析,提出非线性回归分析的分析结果依赖于人为地设定出合理的期望函数和接 近真实的初估值的缺点。 最后,实例分析中简单讨论了数据处理的方法步骤,解

19、决数据来源,选定 八一钢铁历史数据数量 95 期,分别做了线性和非线性回归分析的程序对比,线 性回归分析中使用 matlab 程序以开盘价、最高价、最低价、成交额、成交量为 自变量,做出多元线性回归函数,并进行相关性程度分析,进行了 10 期收盘价 格预测;非线性回归模型中,实现通过对每日收盘价的统计和规范化建立使用 成都理工大学毕业设计(论文) 5 garch 模型 ,先对数据进行差分规范化,使得数据达到平稳序列,绘制时序图, 确定随机波动比较平稳,考查差分后序列的自相关图确定其相关性,建立模型, 检验模型,实现模型拟合成功后成功预测 10 天的预测收盘价,数据用程序处理 成功。 成都理工大

20、学毕业设计(论文) 6 第 2 章 预测方法概述 预测作为一门实用学科,它所研究的内容就是如何对未来事物的发展进行科 学的估计。所谓经济预测,就是指人们根据对客观经济发展事物及规律的认识, 在观察和分析经济发展过程的历史与现状的基础上,对未来的经济发展趋势做出 合理的判断和估计。以个别经济单位生产经营发展的前景作为考察对象,研究其 各项有关指标之间的联系和发展变化状况的,则属于微观经济预测,如对工业企 业所生产的具体商品的生产量、需求量和市场占有率的预测等。微观经济预测, 是企业制定生产经营决策以及编制和检查计划的依据。 经济预测的方法大体可分为两大类:一类是定性分析法(又称经验判断法), 它

21、是人们通过对事物的性质、特点和已占有情况的分析,依靠主观判断和逻辑分 来析预测事物未来发展状况的其结果只是定性描述和大体估计。常用的定性预 测方法有:市场调查预测法、专家评估法、主观概率法等。另一类是定量分析法 (又称分析计算法),它是人们利用已占有的基础数据资料,通过建立数学模型进 行计算来预测事物未来发展状况的,其结果则比较明确和具体。 随着时代的发展,数学被越来越多的应用到金融中。它也给金融带来了一 场革命。其中最受人瞩目的莫过于金融工程、定量投资以及风险管理。基于以 上理论,除了传统的股票投资分析方法以外,近年来又发展了许多新的股市预 测方法,并且取得了很好的效果7。 2.1 趋势分析

22、法 趋势分析法也称趋势曲线分析、曲线拟合或曲线回归,是根据已知的历史 资料来拟合一条曲线,使得这条曲线能反映负荷本身的增长趋势,然后按照这 个增长趋势曲线,对要求的未来某一点估计出该时刻的负荷预测值。 常用的趋势模型有线性趋势模型、多项式趋势模型、线性趋势模型、对数 趋势模型、幂函数趋势模型、指数趋势模型、逻辑斯蒂(logistic)模型、龚伯茨 (gompertz)模型等,寻求趋势模型的过程是比较简单的,这种方法本身是一种确 定的外推,在处理历史资料、拟合曲线,得到模拟曲线的过程,都不考虑随机 误差。 成都理工大学毕业设计(论文) 7 采用趋势分析拟合的曲线,其精确度原则上是对拟合的全区间都

23、一致的。 在很多情况下,选择合适的趋势曲线,确实也能给出较好的预测结果。但不同 的模型给出的结果相差会很大,使用的关键是根据地区发展情况,选择适当的 模型。 2.2 时间序列法 时间序列,也叫时间数列、历史复数或动态数列。它是将某种统计指标的 数值,按时间先后顺序排到 所形成的数列。时间序列预测法就是通过编制和分 析时间序列,根据时间序列所反映出来的发展过程、方向和趋势,进行类推或 延伸,借以预测下一段时间或以后若干年内可能达到的水平。 设为时间序列中时点 i 的观测值,其样本为 N;每次移动地求算术平均值 i x 所采用的观测个数为 n;则在第 t 时点的移动平均值为 1 M (2-1) t

24、 nti intttt x n xxxx n M 1 1211 1 )( 1 式中 第 t 时点的移动平均值,也可当做 t M 第 t+1 时点的预测值,即 1t y , (2-2) tT My 11 tt My 由(2-2)式可导出: (2-3) nttntntttt xx n xxxx n M 1 )( 1 121 即得 (2-4)( 1 1nttTt xx n MM 由(2-4)可见,在计算各时的移动平均值过程中,若已算得,则用(2-4)式较易 1t M 于迭代计算出 1 M 2.3 灰色预测法 灰色预测法是一种对含有不确定因素的系统进行预测的方法。灰色预测模 型称为 GM 模型,GM(

25、1,1)表示一阶一个变量的微分方程型预测模型。 GM(1,1)是一阶单序列的线性动态模型。 成都理工大学毕业设计(论文) 8 设有数列,, ) 1 ( )0( x)2( )0( x)( )0( nx 对作累加生成,得到新的数列,其元素 )0( x )1( x (2-5)()( 0 0)1( nxix i n ni,.,2 , 1 对数列,可建立预测模型的白化形式方程 )1( x (2-6) )1( )1( ax dt dx 式中:-为待估参数.分别称为发展灰数和内生控制灰数.设为待估, a a 参数向量,则 a a 最小二乘法求解,有: (2-7) n TT yBBBa 1 )( 式中: (2

26、-8) 1)() 1( 2 1 1)3()2( 2 1 1)2() 1 ( 2 1 )1()1( )1()1( )1()1( nxnx xx xx B (2-9) T n nxxxy)(,),3(),2( )0()0()0( 将(2-7)式求得的代入(2-6)式,并解微分方程,有 GM(1,1)预测模型为: a (2-10) a x a xix ai ) 1 () 1( )0()1( 灰色模型法使用短期数据得到的结果比较占优,但是使用长数据列得到的结 果与其它相比,并不占优,数据列过长,系统受干扰的成分多,不稳定因素大, 反而易使模型精度降低,降低预测结果的可信度。 2.4 模糊数学法 模糊推

27、理是在模糊逻辑基础上对模糊命题进行演绎和归纳推理,以完成具 有象人一样的近似判断能力的工作。模糊推理的句型表达如下: 成都理工大学毕业设计(论文) 9 规则:如果是,且是,且是;那么是。 1 x 1 A 2 x 2 A n x n AYB 前提:如果是,且是,且是 1 x 1 A 2 x 2 A n x n A 结论:那么是YB 简记为:BAAA 221 结论为 n AAA 21 B 其中 X, 、Y 为被研究对象的名称,n 为被研究对象的个数。、B 分别是 i A 论域、Y 上的模糊子集, ”表示”且”运算,给出建立在推理规则上的逻 i A 辑运算。 2.5 回归分析法 回归预测可以说是最为

28、古老同时又应用得最为广泛的一种定量预测方法, 是处理多变量相依关系的一种统计方法,它是数理统计中应用最为广泛的一种 方法之一。 它的基本思想是分析预测对象与有关因素的相互关系,选择适当的回归模 型(即回归方程)表达出来,然后再根据数学模型预测其未来状态。 然而在许多实际问题中,由于各种关系错综复杂,要精确的建立变量间数 学表达式又特别困难,同时很多变量之间还受到其它偶然因素的影响,使得这 些变量之间的关系具有不确定性。 回归分析方法就是在大量观测数据的基础上,找出这些变量之间的内部规 律,从而定量的建立起一个变量与其它变量的数学表达式。因此简单说来,回归 分析就是研究一个变量与其它变量之间关系

29、的一种统计方法,由于有较为严密 的理论基础和较成熟的计算分析方法,所以,如果模型建立得当,则可得到比 较精确的预测结果。常用的回归模型是多元线形回归模型(一元线性回归模型 只是多元线性模型的一个特例)和多元非线形回归模型3。 成都理工大学毕业设计(论文) 10 第 3 章 回归分析 回归预测方法是以相关性原理为基础的预测方法,是数理统计中回归分析 方法在预测中的应用。从市场现象之间的因果关系出发,通过建立回归预测模 型,根据一种或几种现象的变化去推测另一种现象变化的一种定量预测法。 在经济预测中,人们把预测对象当作因变量,把那些与预测对象有关的因 素当作自变量,收集自变量的充分数据,应用相关分

30、析和回归分析求得回归方 程,并利用回归方程进行预测。 在回归预测中,预测对象 y 是一个随机变量,与之相关的普通变量 x 或一 组普通变量,称为自变量。如果对于自变量的每一个取值或每 1 x 2 x 3 x n x 一组取值,预测对象 y 的取值都有相应的分布。但由于变量间关系的复杂性或 由于统计数据、试验数据不可避免地存在随机误差而使它们之间的关系带有不 确定性,使预测者无法得到描述它们之间关系的精确的数学表达式,那么,就 需要用回归分析的方法,通过大量的统计数据或试验数据,寻找它们之间潜在 的统计规律性,并以回归方程做出描述。根据回归方程,就可以由一个或多个 自变量的给定值对预测对象做出估

31、计和预测。 回归预测法中的自变量与因变量之间,有的属于因果关系,有的属于伴随 关系。不能认为只有因果关系才能进行回归预测,实际上伴随关系也是一种相 关关系,只要收集大量的足够的资料,也可以用回归预测法进行预测。在回归 预测法中,自变量不是随机的或者是给定的,这与相关分析中自变量有所区别。 相关分析中的自变量是随机的。 由于回归分析方法有较严密的理论基础和较成熟的分析、计算方法,同时, 各种社会现象都普遍地与某些因素存在着不同程度的相关关系,所以回归预测 方法在股票市场的预测中得到广泛的应用6。 以下则初步介绍怎样运用回归分析的方法描述这种关系,并据此进行股票 市场预测。 成都理工大学毕业设计(

32、论文) 11 3.1 线性回归分析 3.1.1 一元回归模型 应用回归分析法进行经济预测的关健就是建立回归方程当一个自变量与因 变量(即预测对象)之间相关关系的统计规律呈线性关系时,就称其为一元线性回 归。一元线性回归分析预测法,就是处理一个自变量与因变量间线性关系的一种 用途很广的方法。 该方法简单、适用,可用于处理有因果关系的经济方面的统计数据。 一元线性回归的基本模型为: bxay 其中,y 为预测对象少的估计值。 x 为自变量,是预测对象的相关因素; a.b 为回归系数,回归直线由回归系数来确定。 a 和 b 应满足条件:使回归线在总体上与各个数据点最为接近。回归系 数 a、b 是根据

33、最小二乘法和已知的样本资料求出的,其求解结果是: 2 1 11 22 1 11 2 1 2 1 1111 )( )( )( )( 1 1 xx yyxx xnx yxnyx x n x yx n yx b xbya 式中:,分别为自变量 x 和预测对象 y 的统计数据,分别为 x 和 i x i y x y y 所取统计数据的平均值。按上述公式求出回归系数 a 和 b 后即可确定回归方 程。根据回归方程,可以由给定的自变量的取值 x,对预测对象少的取值做出 预测。 线性回归预测是在假定 y 与 x 之间存在着线性关系的条件下进行的。线性 回归预测模型能否做出较好的预测,这取决于 y 与 x 之

34、间呈线性关系的近似程 度。 y 与 x 之间在多大程度上可以近似地认为它们之间存在着线性关系,不能 仅凭散点的分布直观判断,还应当通过相关性检验做出定量判断。 相关性检验是根据 y 与 x 的相关系数来判断它们之间的线性关系。相关系 成都理工大学毕业设计(论文) 12 数 r 的绝对值越接近于 1,则 y 与 x 越接近于线性关系。越接近于零,则rr y 与 x 越偏离线性关系。只有当足够大时才能以线性回归模型进行预测。确r 定 y 与 x 之间线性关系的恰当的值,可以从相关系数临界值表上查出临界值r 行判断。当时即可认为 y 与 x 之间存在着显著的线性关系。相关系数: a r a rr 可

35、由下式求得: n i ii n i ii yyxx yyxx r 1 22 1 )()( )( 由于线性回归模型是对 y 与 x 关系的近似描述,所以当以回归模型进行预 测时,得到的预测值 y 也只能是近似的。这就需要对预测值的置信区间做出判 断。预测值的置信区间可由下式计算: n i i n i i a xx xx n yy n t 1 2 2 01 2 0 )( )(1 1 2 )( )2(2 y y上 下 式中表示预测置信区间的上、下限。 是显著性水平为, 上 下 y)2(2/tan 自由度为 n-2 的 t 分布临界值。 它可以根据所确定的显著性水平和所取样本数 n 从 t 分布表中查

36、出。 3.1.2 多元回归线性分析模型 在股票市场预测中,由于股票市场这一经济现象的复杂性,预测对象往往 不是仅与一个自变量有关,而是受到多个相关因素的共同作用。为了全面地描 述预测这一经济现象与诸相关因素的关系,更有效地做出预测,就需要建立有 多个自变量的回归预测模型。具有多个自变量的回归预测称为多元回归预测4。 假设预测对象 y 与一组自变量, ,存在着线性回归关系,那么预 1 x 2 x n x 测对象与这一组自变量之间的关系可以用多元线性回归方程 nnx bxby 22110 xbb 成都理工大学毕业设计(论文) 13 来描述。式中, , ,为回归系数。 0 b 1 b 2 b n b

37、 回归系数的确定同一元回归分析相类似,是以预测对象 y 及各自变量, 1 x ,的统计数据按最小二乘法求出。 2 x n x 设分别是, , ,的最小二乘估计值,于是有 n , 210 0 b 1 b 2 b n b (3-1) nnx xxy 22110 式(3-1)中,是 y 中的一个最小二乘估计.对于每一个试验数据 y ,由式(3-1),可得一个,即, inii xxx, 21 mi, 2 , 1 i y inni xbxbby 110 .这里称为实际值的回归值。mi, 2 , 1 i y i y 显然,回归值与实际值有误差,即 i y i y )( 110inniii xbxbbyyy

38、), 2 , 1(mi 当然我们希望与值偏离程度越小越好,这样才能使回归值与实际值 i y i y i y 拟合得最好,这里和偏差越小是指每一个和,于是对全部观察值(实 i y i y i y i y i y 验值)有: ),(min )(min )(min 10 1 2 110 1 2 n n i innii n i ii bbbQ xbxbby yy 为此我们可以用微分学中求极值的原理来确定, , , 0 b 1 b 2 b n b (3-2) n i ijii j n i ii njxyy b Q yy b Q 0 1 0 ), 2 , 1(0)(2 )(2 整理化简为 成都理工大学毕业

39、设计(论文) 14 (3-3) n i iim n i imi n i im n i iim n i im n i iimim n i i n i ii n i i n i i n i im n i im n i i n i i yxxxxbxxbx yxbxxbxxbxbx ybxbxbxnb 11 2 2 1 1 1 10 1 1 1 1 12 1 211 1 2 10 1 1 10 2 0 21 0 10 这里令 XX xxxxxx xxxxxx xxxn A T n i im n i imi n i imi n i im n i imi n i ii n i i n i i n i i

40、m n i i n i i 1 2 1 2 1 1 1 1 1 1 21 1 2 1 1 1 11 2 1 1 YX y y y xxx xxx yx yx y C T nmmm n n i iim n i ii n i I m 2 1 21 12111 1 1 1 1 111 m b b b B 1 0 所以(3-2)式可用矩阵形式表示为 YXBXx TT )( 或CAB 如果系数矩阵 A 满秩,则存在,此时有 1 A 成都理工大学毕业设计(论文) 15 (3-YXXXCAB TT11 )( 4) 这里式(3-4)即为多元回归方程中参数的最小二乘估计。 建立多元线性回归方程之前,通常先对预测

41、对象 y 与各个自变量的关系进 行分析,描绘出 y 与各个自变量的散点图。如果预测对象与自变量之间为某种 非线性关系,则须以类似一元非线性回归的方法,通过变量代换转化为线性关 系来处理。 多元回归预测是一元回归预测的推广,其基本原理和步骤与一元回归预测 大致相同,只是多元回归预测的方法要复杂得多,计算量要大得多。 多元线性回归模型为:xy 其中, ,),.,( 21 n yyyy mnmm n n xxx xxx xxx x 21 22221 11211 111 , n 10, ),( 10 n 其中 X 为设计矩阵,为参数向量。利用最小二乘法我们可以得到参数向 量的解为: yxxx 1 )(

42、 n xyxy) () ( 2 这里通常假定模型满足如下条件: 1)随机误差是不相关的, 即 , 0)(E 2 )(Var0),( ji Covji 2)解释变量与误差相互独立,即 0)(xE 3)解释变量之间线性无关,即 成都理工大学毕业设计(论文) 16 1)( mXRank 3.1.3 线性相关程度测定及相关性检验预测 运用回归模型预测的关键是准确地把握住预测变量与相关变量之间的相关 程度,只有在变量之间存在着密切的线性关系时,所建立的线性回归模型涉及分 析预测,才会变得有意义和有价值。 因此,对于有不同的变量,往往先进行相关分析,然后再选有明显关系的变量 进行回归分析。在回归分析中,两

43、个变量间相关程度的测定,一般通过计算相关 系数 r 并进行相关显著性检验判定。相关系数 r 的计算公式为: 22 )()( )( yyxx yyxx r ii ii 相关性检验:在计算相关系数 r 的基础上,再通过查相关系数检验表可 得到的值,并将其与|r|进行比较(注: 为显著性水平,一般取 0.01)2( nra 或 0.05;n 为已知的自变量(即因变量)的数据个数;n-2 称为自由度)。若| |r (n-2),则表明在 显著性水平上 y 与 x 之间的线性关系是显著的。|r|越接 a r 近于 1,预测变量 y 与相关变量 x 的相关程度就越高。 当 0.7|r| |t| Lag MU

44、 0.04304 0.02843 1.51 0.1336 0 MA1,1 -0.10646 0.10571 -1.01 0.3166 1 MA1,2 0.29892 0.10127 2.95 0. 4001 2 MA1,3 -0.09634 0.10633 -0.91 0.3673 3 图4-9 模型检验图2 由于 P 值均大于=0.05,故各参数均显著。 所以模型拟合成功。 4.4.6 模型预测 对未来 10 天收盘价的预测: 成都理工大学毕业设计(论文) 33 图4-10 预测结果图 即未来 10 天的收盘价为: 9.6793,9.6079,9.6830,9.7260,9.7690,9.8

45、121,9.8551,9.8981,9.941 2,9.9842. 4.4.7 绘图 将序列拟合值与序列观察值联合作图,如图 4-11,星号是为序列观察值, 红色曲线为模型拟合值,由图知,拟合效果较好。图中绿色曲线给出的是 95% 预测区间。 x 4 5 6 7 8 9 10 11 12 t 0102030405060708090100110 图 4-11 预测图 成都理工大学毕业设计(论文) 34 4.4.8 结果分析 未来 10 天的收盘价为: 9.6793,9.6079,9.6830,9.7260,9.7690,9.8121,9.8551,9.8981,9.941 2,9.9842.对比数据 9.89,9.75,10.09,10.95,10.73 差距分别为 0.2107,0.1421,0.407,1.224,0.961 平均误差 0.58896,误差值小,相对多 元线性回归不需要更多的当期相关数据,直接可以利用历史数据进行预测,进 行真正意义上的收盘价预测。 成都理工大学毕业设计(论文) 35 结 论 非线性回归分析是目前统计学中继线性回归分析之后备受关注的统计方法 之一。本文讨论了各种预测的一般方法,重点线性回归模型和非线性回归模型 的对比,回归预测有着好理解,操作

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 研究报告 > 信息产业


经营许可证编号:宁ICP备18001539号-1