关键词:
居民消费价格指数
机器学习
SHAP解释方法
摘要:
居民价格消费指数(CPI)反映了居民购买生活消费品和服务价格变动趋势和程度。从世界大背景看,2021年下半年到2022年,全球物价水平上涨形势愈加严峻,处于比较严重的通货膨胀状态。近几年我国通胀表现相对温和,但2022年6月到8月有所上升。在我国,CPI是衡量通货膨胀的重要指标,也是宏观经济分析与决策的重要指标,因此对CPI进行研究和有效预测十分必要。本研究旨在通过过往文献研究中找出CPI可能的影响因素,挑选一系列指标建立模型,对未来的CPI做出较精确的预测;同时分析各个指标是如何对CPI产生影响的,以及这种影响的重要程度,从而在有关部门制定缓解通胀的政策时提供参考。在以往对CPI影响因素的研究中,货币发行、投资、利率、汇率等宏观经济指标都被证明与CPI会产生显著影响,而这些各种指标基本可归纳到需求拉动、成本推动、货币政策、金融市场、预期类和结构性等六类因素中;在CPI预测模型的应用方面,传统的ARIMA模型、向量自回归等时间序列模型应用最为广泛,而随着机器学习方法的兴起,研究者开始尝试用机器学习的各种模型对CPI进行研究,因为这些模型既可以加入更多变量,又能拟合经济指标之间复杂的非线性关系,在实践中往往有效的提高了CPI的预测精度。针对机器学习模型的“黑盒”特点SHAP解释方法的发现为研究者提供了一个分析机器学习模型中各特征对因变量影响能力大小和方向以及他们之间相互作用的方法。因此针对研究目标,采用多种机器学习模型对CPI进行预测,并且与传统模型进行对比,再选取最佳模型用SHAP法进行CPI影响因素的分析。第一部分和第二部分为绪论和模型方法介绍,第三部分为指标体系构建和数据处理,首先通过过往的文献搜集和经济学原理支持,按需求拉动、成本推动、货币政策、金融市场因素、预期类和结构性六大类因素建立CPI的预测指标体系,对部分指标数据采取三次样条插值等预处理方法统一为月度数据;然后进行时差相关分析和脉冲响应分析,对每个指标筛选合适的滞后项分别代表该指标在短期、中期或者长期对CPI的影响,作为预测模型的特征进入模型。第四部分建立随随机森林回归、K近邻(KNN)回归、极端梯度提升(XGBoost)回归、支持向量回归(SVR)、以及BP神经网络(BPNN)五种非线性机器学习模型,与Lasso回归、岭回归两种线性模型和SARIMA、向量自回归(VAR)两种时间序列模型进行对比,选择平均绝对误差(MAE)、均方误差(MSE)、决定系数(R2)作为模型预测性能的评价指标,发现KNN回归和SVR样本外预测性能较优,MAE约为0.32,其次是随机森林回归,这三种机器学习模型均优于传统模型;对于表现较优的KNN模型,再通过SHAP解释方法对CPI的影响因素进行分析,研究各特征对当下CPI同比增速影响的大小和方向,分析近期CPI有所上涨的原因,以此得出第五部分的结论和政策建议本文的主要研究结论为:第一,机器学习模型预测性能整体表现最好的是KNN回归模型和SVR模型,两者预测的平均绝对误差在0.32左右,随机森林回归模型次之,三者均优于线性回归模型和时间序列模型,XGBoost回归和BPNN模型在样本外预测表现较差。第二,针对KNN回归模型采用SHAP解释方法,发现绝大多数特征对CPI的影响方向都是正向的,而消费者预期指数、工业生产者购进价格指数以及城镇就业劳动力成本等在长期反而是负向的,从因素分类来看对CPI产生影响最大的是结构性因素和预期类因素,结构性因素下各指标对CPI的影响都非常大,其他三个因素主要影响指标分别为物价预期指数、固定资产投资和社会消费品零售总额、OPEC原油价格指数,而货币政策因素和金融市场因素影响不大。在控制通胀时一般需要重点关注的指标为前一段时间的物价、人们对通胀的预期、国际大宗粮食价格以及较远期的固定资产投资情况。第三,根据对2022年8月CPI预测值的瀑布图分解,发现本轮CPI的突然上涨主要因为国际能源价格、国内非食品类的物价以及国际大宗农产品价格上涨,食品类物价的上涨也有一定的推动,而由于国内疫情的原因,社会消费需求整体减少,人们对消费和物价的预期也较低,导致国内的通货膨胀并没有进一步上升,此外,这些指标对CPI的冲击是在短期、中期或是长期均有说明。相应政策建议为:第一,首先重视食品类的物价上涨,稳定各种食品价格;第二,关注物价预期指数,做好群众的预期管理,防范人们的物价预期对通胀造成的压力;第三,关注国际局势引起的国际大宗粮食价格和能源价格上涨,近期的CPI突然上升与之密切相关,第四,可能由于疫情的影响,国内医疗、服务业等非食品类消费价格上升,有关部门应该密切关注、稳定物价,缓解疫情带来的冲击。