关键词:
网络数据挖掘
支持向量机
金融市场
价格预测模型
关键词提取
摘要:
随着信息通讯技术和互联网的发展,互联网金融信息对金融市场的影响已经越来越不容忽视。某一个新事件的发生或者是网络上对某支股票的热议都在很大程度上左右着金融实践者们的行为,同时进一步影响着股市变化的趋势。另一方面,在金融市场中,传统的金融市场的影响因素同样发挥着巨大的作用,比如货币供应量和通货膨胀,而如何利用机器学习的方法建立对这些传统影响因素对金融市场价格影响的量化模型,也是本文研究的重点。\n 本文的内容主要包含两个部分。第一部分,重点研究互联网上的与金融相关信息对真实的金融市场的影响,主要建立起一套对互联网金融领域中出现的新信息词进行检测和跟踪的算法体系,并对该新信息词所代表的事件进行倾向性分析,从而为金融从业人员提供决策支持。第二部分,重点利用SVM算法对金融市场的价格进行预测,其中又包含两个方面。一个是从互联网上的舆论对某支个股价格走势的影响研究,另一个是研究宏观经济层面的流动性和通胀因素,对中国A股市场整体的影响,主要通过对股指的预测来实现。具体来说:\n 在新信息词的检测方面,本文提出了基于信息熵和均值方差模型的检测方法,改变传统的热点词检测方法只注重当天出现的绝对数量,而忽略其相对程度的缺点。进一步,我们还对这些新信息词背后所代表的事件进行倾向性分析,从而得到该新信息词出现对金融市场的影响是正面还是负面。实验表明,本方法可以有效的检测到金融市场上的重大事件,并且可以对其对市场的影响方向给出明确的答案,为金融从业者了解市场、制定决策提供支持。\n 在利用SVM研究金融市场价格预测方面,首先通过对A股市场上的一支典型个股万科的研究,通过采集和利用文本倾向性的方法对互联网上出现的相关信息进行褒贬处理,然后得到每日的互联网舆情的倾向,通过SVM的方法对其价格走势进行预测。研究完个股之后,对于整个金融市场走势,通过对过去十年的中国股市场走势及资本流动性指标和通货膨胀系数的研究,同样利用SVM的方法,试图把流动性、通胀与股指走势联系起来,建立起一个可用的模型。两方面最终都通过实验给出了结论。