基于近端强化学习的股价预测方法
来源期刊:控制与决策2021年第4期
论文作者:岑跃峰 张晨光 岑岗 赵澄
文章页码:967 - 973
关键词:股价预测;机器学习;近端优化;强化学习;时间序列;量化交易;
摘 要:股价预测一直是金融时间序列研究的热点和难点,采用一种合理有效的股价预测方法对于投资者获取高额收益回报及规避交易风险具有重要的指导意义.通过结合近端策略优化(proximal policy optimization, PPO)和强化学习(reinforcement learning, RL),将股价预测视为一个时间序列预测问题,提出一种近端强化学习的股价预测方法 (PPORL).此外,在预测方法的基础上引入股票的相对强弱性能和股票均线指标,提出一种能够自动捕捉潜在交易点的量化交易策略,期望在获取高额收益的同时降低交易过程中存在的风险.通过实验对比了长短期记忆网络(long short-term memory, LSTM)和循环神经网络(recurrent neural network, RNN)模型在上证指数(SZZS)、深证成指(SZCZ)和沪深300指数(HS300)上的预测性能和交易决策表现,并利用多种误差评估方法对预测结果进行定量分析,从而验证了PPORL在预测性能和交易决策等方面的有效性和鲁棒性.
岑跃峰1,张晨光1,岑岗1,赵澄2
1. 浙江科技学院信息与电子工程学院2. 浙江工业大学经济学院
摘 要:股价预测一直是金融时间序列研究的热点和难点,采用一种合理有效的股价预测方法对于投资者获取高额收益回报及规避交易风险具有重要的指导意义.通过结合近端策略优化(proximal policy optimization, PPO)和强化学习(reinforcement learning, RL),将股价预测视为一个时间序列预测问题,提出一种近端强化学习的股价预测方法 (PPORL).此外,在预测方法的基础上引入股票的相对强弱性能和股票均线指标,提出一种能够自动捕捉潜在交易点的量化交易策略,期望在获取高额收益的同时降低交易过程中存在的风险.通过实验对比了长短期记忆网络(long short-term memory, LSTM)和循环神经网络(recurrent neural network, RNN)模型在上证指数(SZZS)、深证成指(SZCZ)和沪深300指数(HS300)上的预测性能和交易决策表现,并利用多种误差评估方法对预测结果进行定量分析,从而验证了PPORL在预测性能和交易决策等方面的有效性和鲁棒性.
关键词:股价预测;机器学习;近端优化;强化学习;时间序列;量化交易;