关键词:
数据挖掘
量化交易
深度学习
强化学习
摘要:
量化交易是指借助数学和统计学方法,利用计算机技术来进行交易的一种证券投资方式[1]。相比主观交易,量化交易者可以通过交易程序有效地减少非理性交易决策,从而实现较为稳定的盈利。近年来,如何在量化交易领域中使用机器学习技术已经成为金融科技的一个中心话题[2]。然而,将人工智能技术运用到量化交易中面临着许多挑战,例如如何表征充满噪声的高频金融数据,以及如何自动化开发量化交易策略。对于表征高频金融数据任务来说,由于有价值的信息往往和噪声信息共存于高频数据中,所以股票高频因子提取器在训练过程很可能会受到金融噪声(价格的微小扰动)的干扰从而导致过拟合,而常见的用于防止过拟合的技巧通常从限制模型参数量的角度出发,难以对高频数据中复杂的交易信号进行建模,导致这些技巧在防止金融数据过拟合任务中的性能较差。换句话说,在设计高频因子提取器时,面临着这样的困境—容量大、表达能力强的模型很容易对噪声过拟合,而简单、稳健的模型无法捕捉高频数据中复杂的特征。为了解决这些问题,本文构造了两个不同的模块,通过交互的形式来利用有效的信息和消除噪声,以便在保持模型表达能力的同时防止过拟合。具体来说,本文提出了一个新的学习框架Digger-Guider,用于从含有噪声的高频数据中提取有用的股票表征。我们开发了一个大容量模型Digger,通过提取局部和细节特征来挖掘高频数据中包含的有效信息。另外,我们还设计了一个较为鲁棒的模型Guider,用于捕捉全局趋势特征,并帮助Digger克服噪声。在训练过程中,Digger和Guider通过互相蒸馏来实现交互,互相蒸馏机制能够作为一种数据驱动的正则化方法来提高模型的整体性能。我们在真实股票数据集上做了大量的实验,实验结果表明,该框架能够提取出有效的股票高频因子,这可以显著提高模型在股票趋势预测任务上的性能并加深对金融市场的理解。完整的量化交易除了包括价格趋势预测,还包括交易策略设计。本文提出了一种自适应的交易模型iRDPG,利用智能体自动化开发量化策略。我们通过深度强化学习算法和模仿学习技术来增强模型。具体来说,考虑到金融数据的噪声,本文将量化交易过程描述为一个部分可观测的马尔可夫决策过程,同时,引入模仿学习技术,利用经典交易策略帮助智能体平衡探索和开发。实验中使用分钟频率的股指期货数据集来训练智能体,实验结果表明,模型能够提取出稳健的市场特征,并能适应不同的市场环境。