1、第5章 模型的验证基于深度学习的股票价格预测研究 摘 要随着经济的发展,中国股票市场的规模持续扩大,早已成为金融投资的重要部分,掌握股票市场的变化规律无论是对监管者还是投资者都具有极其重要的意义。正因如此,人们不断探索着股票市场的变化规律,其中使用深度学习预测股价是当前国内国际研究与应用的热点。本文首先从有效市场假说和分形市场假说两个角度讨论了中国股票市场的有效性,说明股票市场具有复杂的非线性特征。其次,结合股票市场特征对比了当前的预测方法,认为深度学习在股价预测中更具优势。接着,基于深度学习中的长短期记忆网络进行股价预测实验。通过对比试验,本文得出了长短期记忆网络在预测股价方面比三层全连接网
2、络更有实际意义的结论,同时发现了多日数据作为输入变量较单日数据更加准确,增加训练数据在一定程度上能提高准确率,且模型的预测准确率能达到68%。最后,本文重新选取了10支股票进行预测,以此进一步验证模型的效果。预测结果的平均准确率为62%,且能为绝大多数股票带来了正向效益,说明了模型具有适应性,进一步证明了深度学习在股价预测方面的意义。关键词:股价预测;人工神经网络;深度学习;长短期记忆网络AbstractWith the development of economy, the scale of Chinas stock market continues to expand, which has
3、 already become an important part of financial investment. It is of great significance for both regulators and investors to master the changing rules of the stock market.Firstly, this paper discusses the efficiency of Chinas stock market on the basis of efficient market hypothesis and fractal market
4、 hypothesis, which shows that the stock market has complex nonlinear characteristics. Secondly, combining with the characteristics of the stock market, this paper compares the current forecasting methods. Obviously deep learning has more advantages in stock price forecasting. Then, the stock price p
5、rediction experiment is carried out based on Long Short-term Memory Network (LSTM) in deep learning. The prediction results show that LSTM is more meaningful than the 3-layer fully connected network in predicting the stock price. The prediction accuracy of the model can reach 68%, and it has certain
6、 prediction ability. Finally, this paper selects 10 more stocks for prediction, with an average accuracy of 62%. The prediction of the model brings positive benefits to 9 stocks out of 10, which indicates that the model has applicability and further proves the significance of deep learning in stock
7、price prediction.Keywords: Stock Price Forecasting;ANN;Deep Learning;LSTM目 录摘 要IAbstractII目 录III第1章 绪 论11.1 课题背景及研究的目的和意义11.1.1课题背景11.1.2研究的目的和意义11.2国内外研究现状21.2.1中国股票市场有效性相关文献综述21.2.2神经网络相关文献综述31.2.3国内外研究现状评述61.3研究内容和方法71.3.1研究内容71.3.2研究方法7第2章 相关概念及理论介绍82.1股票市场相关理论82.1.1有效市场假说82.1.2分形市场假说92.2深度学习相关理
8、论102.2.1人工神经网络简介102.2.2循环神经网络简介122.2.3长短期记忆网络简介132.3本章小结14第3章 股价预测与深度学习163.1股价预测的方法163.1.1技术分析法163.1.2基本面分析法163.1.3统计分析法173.1.4非线性预测法173.2股票价格预测中的问题173.2.1股价数据的特征173.2.2预测方法比较183.3深度学习的兴起193.3.1深度学习的意义193.3.2长短期记忆网络的优势203.4深度学习的具体应用213.4.1数据挖掘213.4.2量化投资213.5本章小结22第4章 深度学习在股价预测中的实证研究234.1数据获取与处理234.
9、1.1数据获取234.1.2归一化处理234.2深度学习构建模型244.2.1实验设置244.2.2模型结构设计244.3模型评价方法264.3.1图表观察264.3.2统计误差264.3.3涨跌预测正确率与收益率274.4预测结果分析284.4.1单日输入预测实验284.4.实验评价334.4.3多日输入预测实验334.4.4实验评价384.5本章小结38第5章 模型的推广395.1股票选择395.2统计误差分析395.3涨跌预测正确率及收益率405.4综合评价415.5本章小结41结论42参考文献43致 谢45附 录 一46附 录 二47第1章 绪 论1.1 课题背景及研究的目的和意义1.
10、1.1课题背景中国的股票市场经历了三十多年的发展,已经走过了西方国家上百年的路程。随着经济的发展,中国股票市场的规模持续扩大。截至2019年底,中国沪深两市上市公司共3777家,总市值59.29万亿元,较2018年底增长了15.8万亿元,占全球总增长的12.3%。对企业而言,股票市场提供了直接融资的途径,一定程度上满足了企业的资金需求;对投资者而言,股票是投资理财的重要产品,拓宽了投资者的投资渠道;对整个国家而言,股票市场能积极调动社会的闲散资金,提高资源优化配置,推动经济的发展。我国证券市场不断壮大的同时,越来越多的计算机技术也被应用到探索和分析证券市场规律,深度学习就是其中之一。总的来说,
11、深度学习是机器学习领域的一个子集,是实现人工智能的一种重要方式。虽然深度学习的理念可以追溯到上个世纪六七十年代,但是直到近些年来才走进人们的视野,变得火爆起来。如今的时代,信息爆炸满足了深度学习需要的大量的数据,CPU、GPU和云计算的发展满足了深度学习需要的大量计算力,以及优秀算法大大缩短了训练周期,这些共同使得深度学习的实现变得越来越容易。世界上十大对冲基金中,其中八个都采用量化交易的方式,在这之中深度学习必不可少。1.1.2研究的目的和意义本文旨在将深度学习相关技术应用到金融数据的预测中,尝试建立能反映股票价格趋势的模型。我国的股票市场监管制度依然不够完善,不时出现股票的暴涨暴跌,这对国
12、家金融市场的发展是极为不利的。对于国家而言,股票市场是国民经济的晴雨表,可以通过探索股票市场的变化规律对未来经济有合理的预期,从而及时做出相应的政策,稳定经济的发展;对监管机构而言,掌握股票市场的变化规律能一定程度上为监管者提供决策依据,完善金融市场体制;对投资者而言,需要探索股票市场的规律来规避投资风险,获得收益。自从股票市场诞生以来,人们以各种方式探索和研究着其变化规律,并取得了许多研究成果。预测股票市场的变化十分困难,因为股票市场是一个非常复杂的非线性非平稳系统,受很多因素的印象。在传统的预测模型中大多都是采用线性模型拟合股价,如自回归模型、移动平均模型等,但很难适应股票市场的变化。深度
13、学习是机器学习中一个新兴的领域,建立在模拟人脑分析学习的神经网络的基础上,具有学习能力强、非线性映射能力强、适应性好等优点,有着广泛的应用,如自言语言处理、图像识别等领域。深度学习有五种常见的网络,分别是:循环神经网络(RNN)、卷积神经网络(CNN)、生成对抗网络(GAN)、深度信念网络(DBN)、深度强化学习(DRL)。本文将使用一种特殊的循环神经网络长短期记忆网络(LSTM)进行股价预测的研究,并将以近期实际数据进行预测模拟。1.2国内外研究现状1.2.1中国股票市场有效性相关文献综述1.2.1.1有效市场假说根据1970年Eugene Fama提出的有效市场假说,市场可以根据有效性分成
14、三种情况:弱势有效假说(Weak Efficient Hypothesis)、半强势有效假说(Semi-strong Efficient Hypothesis)、强势有效假说(Strong Efficient Hypothesis)。对于强势有效市场,其条件过于苛刻,目前的研究均认为没有市场能够达到强势有效;对于半强势有效的检验,大多数学者结论一致,都认为我国股票市场没有达到半强势有效;对于我国股票市场是否满足弱势有效的问题有比较大争议,学者们分成两派:一是认为中国股票市场依然没有达到弱势有效。孟婷等人(2012)采用自回归条件异方差和Hurst指数两种方法对上海证券市场和深圳证券市场进行检验
15、结果表明中国证券市场未达到弱势有效1。徐悦(2016)首先定性分析了股票市场存在的问题,然后使用游程检验定量分析,认为我国证券市场未达到弱势有效2。张智(2018)采用了单根检验的方法对深圳交易所创业板的证券价格进行检验,得出了创业板日指数未达到随机游走状态的结论,其结果表明创业板市场依然未达到弱势有效3。二是认为中国股票市场已经达到弱势有效。赵浩东(2016)使用单根检验的方法对上证指数进行研究,认为我国股票市场已经达到了弱势有效4。王丽(2017)对上证综合指数进行了自相关检验和单根检验,结果表明上证综合指数符合随机游走过程5。廖宜静和吴瑜琪(2017)检验序列自相关对上海证券交易市场进
16、行研究,结果表明上海证券交易市场已达到弱势有效6。朱瑞(2018)对沪深两市300指数进行游程检验,结果表明我国沪深两市股票市场已达到弱势有效7。1.2.1.2分型市场假说分型市场假说(Fractal Market Hypothesis)是基于有效市场假说发展而来的,其主要建立在非线性系统上,解释了很多有效市场假说无法解释的现象。分型市场假说的市场特征是非线性的开放系统,允许非均衡情况存在,较于有效市场假说条件更宽松,更符合现实情况。关于我国股票市场分型特征的研究,几乎每一位学者都采用了R/S重标极差和Hurst指数进行研究。朱品品和王绍锋(2017)使用上述方法研究了中国创业板股票市场分形特
17、征,秦喜文等人(2016)研究的是沪深300指数的分形特征,孙影(2016)则是深交所上市股票的分形特征,结论都为中国股票市场具有分型特征8 9 10。1.2.2神经网络相关文献综述1.2.2.1浅层网络的应用在机器学习领域,G. Cybenko(1989)证明了有一个著名的万能近似定理(universal approximation theorem)。该定理的主要内容为:在理论上,一个三层前馈神经网络可以拟合任意复杂的连续函数11。一般情况下,神经网络都会包括一个输入层和一个输出层,即三层的神经网络仅包含一个隐含层。通过万能近似定理可以得知,三层的神经网络就已经拥有强大的功能,也正是因为如此
18、三层的网络普遍应用于各个领域。早在上世纪九十年代就有学者采用机器学习的方法来预测股票价格。H. White(1988)使用神经网络预测IBM公司的股票回报率,但最终预测的准确度不高,他认为这是神经网络在训练中陷入了局部极值所导致的12。如今,神经网络得到了长足的发展,已经是股票价格预测的重要方法。国内外的研究集中于实证方面,且研究模型大多采用的是三层的前馈式神经网络。Jinke Li(2019)建立了BP(back propagation)神经网络模型对浦发银行(股票代码600000)和华鑫股份(股票代码600621)两支股票的收盘价进行了预测。结果表明,三层BP神经网络能有效地对股票收盘价
19、进行预测,辅助投资决策是可行的13。同样是建立三层BP神经网络,Wanle Chi(2019)收集了238个工作日的交易信息,对上证指数进行了预测,取得了不错的预测效果14。褚文华(2019)运用了三层BP神经网络对股票数据进行了预测,但最终预测的效果并不好。他认为这是由于选取的样本数量较少所导致的15。黄秋萍等人(2015)建立了三个模型对上证指数进行预测,分别使用了支持向量机(SVM)、BP神经网络和小波神经网络,对比了三个模型的预测效果,结果表明单独使用这三种模型都不能在股票投资中获得稳定的收益16。针对传统神经网络的缺陷,很多学者采用了和其他模型相结合的方法进行改进来提高精度。为了解决
20、神经网络容易陷入局部极值的问题,不少学者进行了研究。Arnold F.Shapiro(2002)创新地结合了多个算法,使用遗传算法(GA)对神经网络进行优化,形成了一个复合式的预测模型,他对每种技术的优缺点及性质进行了讨论17。但是没与具体的应用,也没有与单个网络进行对比。Zhang Yudong和Wu Lenan(2008)使用改进的细菌趋化性优化(IBCO)方法改进神经网络,建立了一种有效的股票指数预测模型18。Feng Li(2009)等人提出了基于利用Levenberg-Marquardt算法对神经网络法进行改进,并进行了股票价格的预测,有效的避免了局部极值,取得了不错的短期预测成果1
21、9。黄宏运等人(2017)使用了遗传算法改进后的BP神经网络模型进行股票指数预测,收敛速度明显加快,预测性也得到了提高20。谢梦蝶和秦江涛(2019)使用遗传算法优化了BP网络的初始权值和阈值,构造出了准确率更高,收敛速度更快的模型21。邓烜堃等人(2018)对输入数据进行了主成分分析降维以及归一化的预处理,使用带动量项的BP学习算法进行训练,较传统方法精度更高22。罗成(2019)对输入数据的降维处理采用了奇异值分解法(SVD),这样降维后再使用神经网络进行训练,最终取得了较好的成果23。胡玲燕和朱家明(2019)结合了逐步回归和BP神经网络构建了模型,在股价的短期预测中取得了一定成果24。
22、1.2.2.2深度学习相关文献综述深度学习是机器学习中使用深度神经网络的子领域,不可避免的会使用深度神经网络。浅层神经网络通常只包含一个或两个隐含层,而深度神经网络则会包含更多的隐含层。特别是在时间序列问题中,多数学者采用了循环神经网络(RNN)或长短期记忆网络(LSTM)来实现。Xiong等人(2015)构建LSTM神经网络预测了标准普尔500指数的波动率,证明了通过深度学习和神经网络模型可以更好地预测股票市场的行为25。Onchar等人(2017)使用人工神经网络来预测股票指数,使用了多层感知器(MLP)、卷积神经网络(CNN)和长短时记忆(LSTM)递归神经网络,三种网络的准确率相近并且
23、均在60%以上26。Jiang Q等人(2018)以上证综合指数和道琼斯指数的每日数据为研究对象,分别使用RNN和LSTM来构建模型,比较了LSTM和RNN两种网络在预测时间序列问题上的优缺点。对比后发现,LSTM可以很好地用于股票价格预测27。邓凤欣与王洪良(2018)使用长短期记忆网络(LSTM)对微软、亚马逊等个股进行了预测,证明了该模型在预测个股价格趋势中有较高的精度28。乔若羽(2019)建立了包括卷积神经网络(CNN)、递归神经网络(RNN)和长短期记忆网络(LSTM)等神经网络模型进行对照,充分研究了不同变量对于不同网络性能的影响29。宋刚等人(2019)使用粒子群算法对长短期记
24、忆网络(LSTM)模型中的关键参数进行优化,并与其他单个预测模型比较,证明了优化后的模型精度更高且具有一定的普适性30。孙存浩等人(2020)建立了BP神经网络与长短期记忆网络(LSTM)相结合的BP-LSTM模型,并与传统的LSTM模型进行对比,证明新模型精度和稳定性上都有较大提升31。赵浩博和李锡祚(2019)提出了一种基于卷积和循环神经网络的股票开盘价预测研究方法,在输入变量中加入了相关新闻数据进行训练,实验结果表明,该方法在股票开盘价预测上具有明显的优越性32。吉睿(2019)将数据指标行了离散化处理,同时加入了宏观经济指标作为LSTM网络的输入,结果表明离散化处理和宏观经济指标的加入
25、都能提高股价预测的精确度33。张旭东等人(2019)建立了五层的神经网络来实现对股价的预测,其中使用了两层LSTM网络,实验表明该模型预测效果明显优于传统人工网络模型34。段梦冉(2019)建立了有200个隐藏神经元的LSTM网络,对上证指数进行预测。利用了正则化方法提高了模型的鲁棒性,得到了预测效果较好的模型35。1.2.3国内外研究现状评述对于中国股票市场的有效性方面,学者们大多根据自相关检验、单边检验等方式来验证我国股票市场是否满足有效市场假说中的弱势有效。有效市场假说的推论中认为若市场满足弱势有效,则通过历史价格信息不能预测无法未来的走势,技术分析将失去作用。虽然对市场是否弱势有效的看
26、法依然存在争议,但是有效市场假说研究的是线性关系,学者们采用的检验方法也都是检验线性相关,即使满足弱势有效也不妨碍历史价格信息在某种非线性系统中包含了对未来价格的信息。对分型市场假说的研究也证明了这一点,中国股票市场复合分型市场特征,并且该假说还提供了对这种非线性市场的特殊预测方法。因此,使用深度学习发掘股价数据中的非线性关系,从而股价预测是可能实现的。在浅层网络的应用中,大多数学者采用了三层的神经网络进行研究。针对传统神经网络的缺陷,很多学者采用了和其他模型相结合的方法进行改进来提高精度,如采用遗传算法、粒子群算法等避免局部极值问题。但是,在如今很多神经网络一直存在的问题都得到了很好地解决。
27、针对局部极值问题或者深度学习中的鞍点问题,目前已经有了成熟的基于动量的梯度下降算法和RMSprop算法结合(bias correction)的优化算法,因此在此问题上无需使用其他算法优化,本文将直接采用Adam算法解决此问题。另一方面,虽然理论上浅层神经网络也能以任意精度逼近任意复杂的连续函数,但是浅层神经元面对复杂的非线性系统时需要足够多的神经元来提升网络的拟合能力,这时使用到深度神经网络的效果就会更好。特别是在时间序列问题中,大多学者采用了循环神经网络(RNN)或长短期记忆网络(LSTM)实现,并取得了一定成果。鉴于股价数据的特征,本文也将采用长短期记忆网络(LSTM)来实现预测。1.3研
28、究内容和方法1.3.1研究内容第一章为绪论。主要介绍选题的依据、选题的意义、国内外研究动态、本文的研究内容和结构。第二章介绍本文涉及的相关概念和理论。首先,介绍股票市场的相关理论,其次介绍股票市场常用的技术指标和预测方法,最后介绍与深度学习有关的基础概念和理论。第三章介绍深度学习在股价预测中的应用。首先介绍股票价格预测中的问题,其次介绍神经网络的特点,尤其是深度学习的特点,最后介绍目前深度学习在金融市场中的具体应用。第四章进行模型的建立与仿真和投资策略的设计。首先进行数据的选取和处理,其次进行网络结构的搭建,并通过实验不断修改结构,然后与三层全连接网络进行对比,最后设计投资策略并计算收益。第五
29、章模型的改进和推广。首先随机选取不同板块的股票并搜集数据,其次使用设计好的模型及投资策略进行仿真,计算误差及收益率。结论与展望。对本文的研究结果进行总结,找出研究过程中的不足并提出接下来的研究方向。1.3.2研究方法1.3.2.1文献研究法通过知网、谷歌学术、百度学术等网站查阅有关深度学习预测股票价格的文献资料,从中找到对本文有用的方法和资料,为梳理好本文的研究思路和内容打下坚实的基础。1.3.2.2数据分析法对历史数据的研究在股价预测中至关重要,是建立模型的基础。本文在雅虎金融网站中爬取了大量股票相关的历史数据,通过深度学习来分析数据中的非线性关系和特征。1.3.2.3比较分析法本文将搭建优
30、化后的模型与未进行优化的模型进行对比分析。对比LSTM网络模型与传统神经网络的预测精度,分析深度学习在股价预测中的有效性。1.3.2.4实证分析法本文通过建立基于深度学习的预测模型对实际股票价格进行预测,将模型应用于实际数据进行实验,测试模型预测的效果。第2章 相关概念及理论介绍2.1股票市场相关理论2.1.1有效市场假说有效市场假说(Efficient Markets Hypothesis)是由尤金法玛(Eugene Fama)于1970年深化并提出的。他提出了,假定市场价格总是充分反映了可获得的信息,则这个市场就是有效的。可获得的信息一旦出现获利机会,投资者们会迅速抓住信息并采取行动,进而
31、股价产生波动来反映该信息,使所有人都不能获得超额利润。该假说有几个重要的前提假设:(1)市场信息是被充分披露的;(2)获取市场信息没有或几乎不需要成本;(3)投资者都是理性的,且都以利润最大化为目标,能够准确分析可获得的信息并且时刻谨慎投资;(4)投资者能对信息迅速做出反应,导致对应的股价波动该理论认为市场可以根据有效性分成三种情况:弱势有效假说(Weak Efficient Hypothesis)、半强势有效假说(Semi-strong Efficient Hypothesis)、强势有效假说(Strong Efficient Hypothesis)。在弱势有效的市场中,证券的市场价格已充分
32、反映了历史价格信息,证券价格的未来走势与历史价格信息是毫无关联的。如果弱势有效假说成立,技术分析将变得毫无用处,但仍可以通过基本面分析预测股市未来的走势。在半强势有效的市场中,证券的市场价格已充分反映了所有有关公司运营前景的信息,包括价格信息和公开披露的所有财务及运营信息,但是未公开的内幕信息没有反应到市场价格中。如果半强势有效假说成立,技术分析和基本面分析将失去作用,内幕消息则可能获得超额利润。在强势有效的市场中,证券的市场价格已充分反映了所有有关公司运营前景的信息,这些信息包括已公开的或内部未公开的信息。强式有效市场假说认为价格已充分地反应了所有关于公司营运的信息,这些信息包括已公开的或内
33、部未公开的信息。在强式有效市场中,没有任何方法能帮助投资者获得超额利润。2.1.2分形市场假说有效市场假说在现代金融市场理论中发挥了重要的作用,占据着重要地位,但是其假设条件与实际相差较大,导致应用范围受到限制,市场中的很多现象都不能得到解释。分形市场假说(Fractal Market Hypothesis)是由Edgar E. Peters于1994年提出的,立足于非线性关系的角度,强调了市场信息和投资期限对投资者行为的影响,被认为更能解释证券市场的波动。该假说的主要观点有:(1)市场由无数投资者构成,且有自己的投资期限(2)投资者对不同的市场信息会做不同的反应(3)资本市场的稳定依赖于流动
34、性,流动性由不同的投资期限、市场信息和接近市场公认的公平价格(4)价格反映了短期技术分析和长期基本面分析的结合(5)如果某项资产与经济周期无关,那么它就不具备长期趋势,其波动主要由交易量、流动性和短期信息决定与有效市场假说中假设的理想的线性市场不同,分形市场假说认为市场是非线性的系统,这与实际情况更为接近。非线性的系统意味着每个投资者的行为是不一致的,在金融市场的表现为:投资者根据自身不同的投资期限,如遭遇下跌时,短期投资止损卖出,而长期投资者可能“抄底”买入,加上对信息的理解不同,从而做出不同的反应。市场的稳定依赖于流动性,而投资者们不同的反应保证着市场的流动性。当投资者们的投资期限和对信息
35、的理解都接近一致时,会导致市场缺乏流动性从而崩溃。如金融危机时,所有投资者都想立刻抛出手中的证券,这就造成了市场流动性的枯竭,无法反应证券真实的市场价值。分形市场假说与有效市场假说的对比见下表:表2-1分形市场理论与有效市场理论的比较有效市场假说分形市场假说系统复杂性简单系统复杂系统市场特征线性孤立系统非线性开放系统可预测性不可预测可预测且提供了新的预测方法均衡性均衡市场允许不均衡存在波动有序性无序有序总体上看,有效市场假说是分形市场假说的一种特殊情况,分形市场假说的适用范围更加广泛,条件更加接近实际。很多研究都表明,欧美股票市场、我国股市都具有分形特征。2.2深度学习相关理论2.2.1人工神
36、经网络简介人工神经网络(Artificial Neural Network,ANN)是现代人工智能领域重要的分支,早在上个世纪五十年代就被提出。2.2.1.1人工神经网络基本原理人类大脑中至少有数十亿神经元细胞,细胞之间互相连接,通过轴突和树突传递信息。细胞中树突接受刺激时,通过细胞活动产生轴突电位,当轴突电位达到一定的值时则会产生新的刺激,表现为细胞将刺激沿轴突末递给连接的其他神经元。树突突触轴突图2-1 神经元细胞和人工神经元示意图仿照人脑工作的原理,创造人工神经元(节点)模拟神经细胞,人工神经元互相连接形成有向图传递信息。这种连接由加权值代表,信号通过两个神经元时会被该权值加权,这个权值
37、相当于网络的“记忆”。每个神经元还会有特定的输出函数,称为激励函数(activation function),类似于人脑细胞判断轴突电位,只有当满足条件时才能将神经元激活,将信息(激活值)传递下去。当足够多的人工神经元组合就会形成神经网络,再经过特定的训练赋予“记忆”就能产生类似人的思维。对于某个特定的神经元,其输入为i=0n-1wixi,输出为:y =fi=0n-1wixi-。 上式中,假设来自其他神经元传递来的信息为xi,为第i个元素的输入,它们与该处理神经元的连接权值为wi,其中i=0,1,n-1,处理单元的内部阈值为。f为该神经元的激活函数,决定了该神经元的输出。由若干个神经元相互连接
38、组成神经网络,其结构如下如所示:图2-2 神经网络结构图总的来看,人工神经网络是一个有向图,每个神经元之间由权值连接,神经网络训练学习的过程就是调整连接权值的过程。2.2.1.2人工智能、机器学习和深度学习之间的关系总体上看,人工智能、机器学习和深度学习之间的关系如下图所示:图2-3 人工智能、机器学习和深度学习的关系人工智能研究的是智能行为的仿真,机器根据预先设置的方法完成任务的行为就是人工智能。实现人工智能需要给机器定义大量的规则,可以采用硬编码的方法但是效率太低,这时就需要机器学习。机器学习是人工智能的一个子集,可以使计算机通过大量数据来学习规则。更具体的说,机器学习是实现人工智能的一种
39、方法。使用机器学习的算法处理可以快速处理大量数据,计算机在这个过程中自我学习,将“规则”进行调整。常见的机器学习算法包括:决策树算法、支持向量机算法、随机森林算法、人工神经网络算法等。由此可见,人工神经网络也只是机器学习的一个子集。深度学习是机器学习中一个新兴的领域,由于算法和计算机计算能力的发展,深度学习成为了可能。人工神经网络与深度学习的关系可以总结为:深度学习是人工神经元网络的发展,人工神经元网络是深度学习的前身。深度学习的本质就是建立包含多个隐含层的人工神经网络,学习大量的训练数据从而使网络具备甄别数据中特征的功能,最终实现诸如预测、分类等功能。深度学习中有五种常见的网络,分别是:循环
40、神经网络(RNN)、卷积神经网络(CNN)、生成对抗网络(GAN)、深度信念网络(DBN)、深度强化学习(DRL)。本文将使用一种特殊的循环神经网络长短期记忆网络(LSTM)进行股价预测的研究,并将以近期实际数据进行预测模拟。2.2.2循环神经网络简介传统神经网络中每次的输入与输出是独立的,而在实际研究过程中,很多时候后续的结果与之前的输入也是有关系的,如序列数据预测、语言识别等问题,每次输入之间并不是独立的。这就需要网络在计算过程中“记住”之前的输入,将之前“记住”的特征与现在的输入一同分析产生输出,于是诞生了循环神经网络(Recurrent Neural Network, RNN)。循环神
41、经网络会沿着序列数据的方向进行递归,每个循环单元(该网络中的神经元)按链式连接,使每次的输出结果不仅依赖于当前输入,也依赖于之前的输入。循环神经网络的结构如下图所示图2-4 RNN结构简图横向来看,该图中x表示输入层,s表示隐藏层,o是输出层,t表示时刻,W是隐藏层存储下来的之前的输入特征,将作为这一次的输入的权重,其本质是一个权重矩阵,U和V是神经网络中的权重矩阵,其激活函数通常为tanh。输出层的计算方法为:ot=gVst=VfUxt+Wst(2-1)隐含层的计算公式为:st=f(Uxt+Wst-1)(2-2)这里用到递归的思想,将(2)式反复带入到(1)式中,直到回到最初的时刻;W为隐藏
42、变量矩阵,捕捉了时间序列的历史信息,同样是递归循环;输出由隐藏变量W和当前输入xt经过权重系数V变换得到。通过以上原理循环神经网络能够具有“记忆”的功能,但其还面临着一个巨大的挑战长期依赖问题。当两个有效信息距离较近时,如输出o3依靠了输入x1和x2的信息,RNN网络可以将这些有用信息进行“记忆”,但是当信息距离较远时,如输出o10要使用输入x1和x2的信息,RNN网络就很难解决。长期依赖的本质是信息经过了多次传播后,其训练梯度接近零,产生了梯度消失的情况。接下来介绍长短期记忆网络来解决这一问题。2.2.3长短期记忆网络简介结合上面的介绍,循环神经网络的内部结构如下图所示:图2-5 RNN网络
43、结构图长短期记忆网络(Long Short Term Memory networks,LSTM)是一种特殊的RNN网络,其内部结构较RNN更为复杂,如下图所示,在控制神经元状态中加入了遗忘门、输出门和输入门。图2-6 LSTM网络结构图从左到右看,首先第一个通道是遗忘门,控制神经元是否需要遗忘部分内容,通常使用sigmoid函数实现;接下来是中间的输入门,控制神经元记住新的信息并更新状态,和上一步相同,信息同样要经过sigmoid,但和RNN网络结构类似,信息还要经过一次tanh,这样神经元细胞就遗忘了该遗忘的信息,记住了新的信息。细胞最后将经过最右边的输出门,并且输出还要经过tanh过滤,得
44、到最终结果。2.3本章小结本章主要介绍了股票市场和神经网络相关理论。一方面,本章介绍了有效市场假说和分形市场假说的理论,并分析了中国股票市场的有效性,进而介绍当前预测股票价格的方法,引出神经网络预测股价的方法;另一方面,介绍了神经网络发展的整体框架,并具体介绍了本文将使用的循环神经网络和长短期记忆网络。第3章 股价预测与深度学习3.1股价预测的方法目前预测股票价格的大致可以分为四种,一是技术分析法,二是基本面分析法,三是统计模型分析法,四是非线性预测法。3.1.1技术分析法技术分析法是最为直观的一种短期预测方法。通过观察股票的量、价、时、空等要素,形成众多技术形态,认为历史情况会重演。根据历史
45、经验总结出的形态,分析即时的行情属于何种形态,从而判断未来走势。技术分析也会参考众多技术指标,相对强弱指标(RSI)、平滑异同移动平均线(MACD)、随机指标(KDJ)等,判断股价的相对高低点,从而进行投资行为。综上,技术分析有很多优点:实现方法直接,不涉及复杂的数学模型,且根据个人判断能得到明确的交易信号,结果集中在短期,适合短期投资。但是缺点也很明显:一方面,技术分析是一种经验总结,十分依赖于投资的个人判断,并且很多“经验”之间互相矛盾,没有统一的理论指导,让投资者难以判断;另一方面,指标经常与所代表的含义背离,表现出严重的滞后性,使判断更加困难。3.1.2基本面分析法基本面分析则面向中长
46、期的预测,通过对国家宏观环境、公司所处行业、公司运营情况等方面的分析来实现。基本分析认为市场价格最终会回归实际价值,通过判断市场价格是否偏离于公司的内在价值进行投资。基本面分析注重大环境的影响,对长期投资者十分重要,有助于比较准确的把握长期的趋势,也有助于投资者进行个股选择。但时间跨度很长,对短线投资者分析短期走势指导意义不大,且易受到突发事件的影响;另一方面,基本面分析的精确度不高。把握公司未来价值中重要的一环在于对公司价值的估值,即使采用相同的估值方法,不同的人对未来的预期不同,所得到的价值也不同,所以基本面分析只能提供一个大致上涨或下跌的趋势,无法提供明确的交易信号。3.1.3统计分析法
47、统计分析法是将股价信息视为时间序列数据,使用各类回归模型进行预测。这些模型大多基于最小二乘法建立,包括多元线性回归、自回归、混合回归模型等。这种分析方法具有准确的实现方法,有统一的指导理论,应用十分广泛。但是这种预测方法依赖于股价信息中的线性关系,在复杂的非线性系统中有一定局限性。3.1.4非线性预测法非线性预测法在股票价格预测中应用十分广泛,常用的方法有模糊集法、混沌理论、基于遗传算法预测、基于人工神经网络预测等,在此处重点介绍基于人工神经网络预测。人工神经网络(Artificial Neural Network)通过模拟人脑神经元的工作原理,使人工神经元按照不同方式连接,进而搭建出不同的网络。对于建立好的神经网络,可以使用大量的数据对人工神经网络进行训练,从而挖掘出隐藏的非线性关系。该方法具有很强的自适应能力、非线性拟合能力,克服了线性预测中的诸多不足,可以达到较高的准确率,但是通过神经网络法建立的模型无法很好的解释变量间的关系,且神经网络还有过拟合、陷入局部极值等缺点。随着神经网络技术的发展,该方法已经成为国际上研究股价的热点,应用于金融领域的方方面面。3.2股票价格预测中的问题不管采用何种方式,投资者都需要对股票进行分析,且投资分析的准确与否是股票投