基于VMD-ML价格预测模型的股指期货量化投资策略思考

发布时间:2022-04-21 18:52:30 论文编辑:vicky

本文是一篇金融论文,本文从实践的角度出发,提出了对应的期货投资策略,并从提高胜率和赔率的角度分别对投资策略进行了优化。在分析各个优化项对策略的优化程度时,采用控制变量法,对策略的优化分别进行了回测及对比分析。

第一章 绪论

1.1 研究背景及意义

1.1.1 研究背景

量化择时策略是根据价格变动特征进行开发的投资策略,是量化投资领域的重要分支。价格预测通常被认为是量化择时策略开发的前提和基础。经过历届学者多年的努力,已经有许多预测金融市场价格的研究方法被提出。最初,学者们使用经典的回归方法来对市场价格进行预测。随着人工智能技术的发展,其在金融研究领域中的应用越来越广泛。近年来,关于机器学习的量化投资策略也常出现在各大研究报告中。

支持向量回归和神经网络是两种被广泛应用于金融时序预测等领域的机器学习算法(ML)[1-5]。相对于传统的机器学习模型,SVR 模型可以摆脱局部最优而达到全局最优。与传统的人工神经网络不同,递归神经网络(RNN)在隐藏单元之间建立连接,可以处理前后关联的数据,非常适合时间序列的预测。长短期记忆神经网络(LSTM)是在递归神经网络的基础上提出的改进模型,它通过加入记忆单元而进一步提升了对重要信息的捕捉能力。正是由于其对历史信息强大的捕捉能力,使得其在自然语言识别、时间序列预测等多个领域得到广泛应用。但目前单纯的机器学习算法依然无法对非稳定且混沌的金融时序进行较精准的预测。

变分模态分解(VMD)是在 2014 年被美国加州大学数学系的 Konstantin 教授提出的一种新的信号分解技术。在美国、中国香港以及英国等金融市场上 VMD 分解已经被验证是一种有效的降噪方式[6]。它不仅可以实现对输入信号的降噪,而且可以有效地抑制经验模态分解中可能出现的模态混叠现象。本文将创新性地将 VMD 分解与多个机器学习算法进行结合,并将其应用于我国金融时序的预测研究中。

1.2 研究思路与方法

1.2.1 研究思路

由于金融市场价格的影响因素复杂、波动性较高,金融时序的预测一直是量化择时策略研究的重点和难点。金融时序难以预测的主要源自于其非稳定、混沌以及非线性的特性。本文针对金融时序非稳定和非线性的两个特性,分别引入变分模态分解和机器学习算法,提出了 VMD-ML 价格预测模型。首先,通过引入变分模态分解(VMD),解决了经典去噪方法无法将金融时间序列中包含的多尺度复杂模态有效分离的问题。其次,通过引入多个机器学习(ML)算法进行对比分析解决单一机器学习算法在时序预测的局限问题。在 VMD-ML 价格预测模型的基础上,本文提出了对应的量化择时策略。最后,本文分别通过对分量序列预测模型的超参数优化以及交易的仓位管理对投资策略从提高胜率和赔率的角度进行了优化。具体研究思路如图 1 所示。

金融论文怎么写


第二章 相关理论及文献综述

2.1 时间序列预测主要方法

金融时间序列由于受经济基本面、政策、群体心理等诸多因素的影响,具有高波动、非线性、非平稳、混沌等特点。金融时序的预测也因此一直是金融领域的难点及热门研究方向。通过总结时间序列研究的相关文献,可以将时间序列预测分为周期因子分析、线性回归、传统时序建模、时间序列分解以及机器学习等方法。

结合金融时序高波动、非线性、非平稳、混沌等特点,本文将采用信号分解技术中的变分模态分解(VMD)对原始金融序列进行处理,解决金融时序中普遍存在的非平稳、混沌的问题;采用机器学习算法中的 SVR 以及 LSTM 模型解决金融时间序列非线性的问题。

经验模态分解(EMD)算法是 Huang 等人所提出的一种针对非平稳时间序列的信号处理方法[22]。它摆脱了傅里叶变化的约束,可以完全自适应性地分解出一系列的分量,同时不需要考虑小波变换中基函数选择的问题。但经验模态分解存在端点效应、模态重叠以及易受噪声影响等缺陷。针对经验模态分解中存在的模态重叠现象,Wu Z和 Huang N E.(2009)提出了集合经验模态分解算法[23]。该算法主要是在 EMD 分解的基础上,多次向输入信号加入白噪声来抑制“骑行波”造成的模态混叠效应。但是,当多个分量存在严重的频谱交叉时,EEMD 并不能有效抑制模态混叠现象。

2.2 变分模态分解相关理论

小波分解(WT)、经验模态分解(EMD)、集合经验模态分解(EEMD)以及变分模态分解(VMD)等都是目前应用比较广泛的信号分解技术[7-9]。小波分解是一种同时进行时频域分析的局部化处理方法,利用基函数对原始序列进行缩放、平移将原始信号,从而将原始序列转化为若干序列的叠加。因此,小波分析具有一定的去噪和时频局部分析功能,但存在时移、频率混叠、依赖基函数的选择以及容易产生虚假谐波等缺陷[10]。N.E.Huang 等(1998)提出了一种旨在解决信号非平稳性的完全自适应的分解技术——经验模态分解(EMD)。它不仅摆脱了傅里叶变化的约束,而且避免了小波变换中对基函数依赖的问题。但是,经验模态分解也存在一定的弊端,比如经常会出现模态混叠现象。针对这个问题,Huang 等(2009)通过加入白噪声,在 EMD的基础上提出了改进算法——集合经验模态分解(EEMD)。该分解算法消除了部分噪声的影响,但当出现显著的频谱交叉时,EEMD 依然不能有效地抑制模态混叠现象。

变分模态分解是由 Konstantin 等(2014)提出了一种解决输入信号中噪声问题的分解技术,可以自适应地确定频带并估计相适应的模态。通过合理地设置预设尺度数K 的值,变分模态分解便可以有效地抑制在 EMD 分解中经常出现的模态混叠现象。Konstantin 等的实验结果显示,在对噪声的处理上,VMD 的性能明显优于 EMD,具有更显著的鲁棒性。与经验模态分解相比,VMD 在对非平稳信号进行处理时,可以更显著地抑制噪声的影响。

第三章 基于 VMD-ML 的价格预测模型研究.......................23

3.1 股指期货价格序列平稳性分析................................. 24

3.1.1 沪深 300 股指期货主力连续合约收盘价平稳性分析..........................24

3.1.2 沪深 300 股指期货主力连续合约对数收益率平稳性分析..................25

第四章 基于价格预测模型的股指期货量化投资策略研究........................... 37

4.1 基于价格预测模型构建股指期货量化投资策略的思路................................ 37

4.1.1 股指期货量化投资策略背景.........................37

4.1.2 价格预测模型的预测胜率及预测盈亏分布分析...................37

第五章 股指期货量化投资策略的优化................................ 45

5.1 基于超参数优化的股指期货量化投资策略胜率优化........................... 45

5.1.1 分量序列 SVR 预测模型的超参数优化.........................45

5.1.2 分量序列 LSTM 预测模型的超参数优化................. 46

第五章 股指期货量化投资策略的优化

5.1 基于超参数优化的股指期货量化

投资策略胜率优化在机器学习中,超参数是用于控制学习过程并提前进行设置的一种参数类型。而其他的参数(如节点权重等)则是可以通过训练自动得出的。超参数的选择会直接影响到学习的速度和质量。为提高价格预测模型的预测精度,以及进一步提升投资策略的胜率,本节针对 SVR 以及 LSTM 的超参数分别进行优化,再次重新对每一个本征模序列进行预测,并择优选取。

5.1.1 分量序列 SVR 预测模型的超参数优化

遗传算法(GA)是通过模仿生物遗传中基因的交叉、变异和自然选择来实现寻优过程的一种算法。本研究将采用遗传算法对 SVR 中的惩罚参数 C 及高斯核函数的参数gamma 进行同时寻优。GA 算法的基本思路是首先初始化一个包含若干个体的种群(population),同时对个体(individual)进行编码,将个体(individual)的表现型转换成基因型,然后对个体进行遗传(复制)、变异和选择等操作。

金融论文参考


结论

本文总结

本文首先针对金融时序预测问题,通过将变分模态分解以及 SVR、LSTM 两种在金融领域应用较为广泛的两种机器学习算法进行集成,提出了 VMD-ML 价格预测模型。该模型通过变分模态分解解决了金融时序非平稳且混沌的问题,通过机器学习算法的比较分析解决了单一机器学习算法对输入序列依赖以及金融时序非线性的问题。该模型不仅在设计上思路清晰,而且泛化能力较强。泛化能力主要体现在对于机器学习模型池的选取、对于预测标的的选取以及对于价格、收益率和波动率等初始输入时序等的选择上。通过与 SVR、LSTM 两种被广泛应用的机器学习算法的预测结果进行对比分析,验证了本文所提的基于 VMD-ML 价格预测模型在预测效果上的显著提升。

同时,本文从实践的角度出发,提出了对应的期货投资策略,并从提高胜率和赔率的角度分别对投资策略进行了优化。在分析各个优化项对策略的优化程度时,采用控制变量法,对策略的优化分别进行了回测及对比分析。实验结果表明:(1)本文所提的 VMD-ML 价格预测模型相对于单纯的 SVR、LSTM 预测模型可以提高预测精度,具有更小的误差(MSE、MAE 和 SMAPE)。(2)遗传算法可以有效优化 SVR 算法中的惩罚系数 C 以及高斯核函数中的参数 gamma;网格搜索可以有效优化 LSTM 算法中的神经元个数以及迭代次数;通过对 VMD-ML 价格预测模型中的超参数优化可以提高本文所构建量化投资策略的胜率,同时提高量化投资策略的累计收益、詹森指数、夏普比率以及索提诺比率。(3)改进的马丁格尔仓位管理策略对本文所提投资策略也具有优化效果,可以通过提升赔率(盈亏比)来提高量化投资策略的累计收益、詹森指数、夏普比率以及索提诺比率。(4)通过对沪深 300 股指期货主力连续合约的价格预测可以构建出显著高于沪深 300 指数收益的股指期货量化投资策略。

参考文献(略)