关键词:
城投债
信用利差
机器学习
XGBoost
SHAP
摘要:
2020年以来,华晨汽车、永煤控股、华夏幸福、紫光集团等AAA级国企债券相继违约,根据Wind数据,自2014年债超日债违约开始,6年间AAA级债券实质性违共计70余只,其中仅2021年就有50余只,占比逾70%。在这一背景下,投资者对违约的担忧上升、风险偏好下降,出现“抱团”城投的现象,越来越多的投资者开始思考是否应该对现有城投风险评价体系进行修正。“国企信仰”已经开始受到挑战,城投刚兑是否能够延续?城投债投资者如何才能获取超额收益与政府如何对城投企业及城投进行下一步调控,是不可回避的两大问题。
由于过往研究中学者多使用线性回归等传统方法,与最近使用机器学习方法进行的研究相比,就信用风险评估而言效果偏差,这或许是由于自变量过多或因变量与自变量间存在非线性关系。本文主要利用不同机器学习模型对城投债利差变动进行预测并评价其预测效果,在此基础上加入传统的线性模型进行对比,然后对最优模型进行解释性分析,研究不同因素对城投债利差变动的影响方向及程度,最后基于前述研究结论对投资者及政策制定者提出建议。本文的创新点主要分为以下几点:(1)研究对象新。本文研究对象与以往文献中常见的城投债发行利差不同,本文脱出静态的时点数据,转而研究动态的利差变动数据。(2)模型选择新。本文主要使用以往文献中使用较少的机器学习方法进行研究,且一次性使用了10中不同的机器学习算法分别进行建模和预测,这在以往的文献中较为少见。(3)解释方法新。以往采用机器学习算法进行相关研究的文献多有欠缺完善的可解释性分析,如XGBoost自带的特征重要性分析有较大的缺陷,本文采用近年新发布的SHAP框架对机器学习模型结果进行可解释性分析,其结果具有较高的可信度。
本文分为五个部分,主要的研究内容和思路如下:(1)引言部分主要简述城投企业的起源与定义,接着以城投监管政策变动为线索梳理城投企业的发展历程,然后详述近年来城投债市场的变动,引出研究城投债利差变动的重要性与必要性;(2)文献回顾部分总结了以往学者对城投债信用风险影响因素相关的研究,发现绝大部分文章均使用传统的线性模型进行分析,接着回顾了近年采用机器学习对债券信用利差研究的部分文章,发现个文章使用的机器学习方面较为单一且对结果的解释性分析较为欠缺,最后引述了部分信用评价领域利用机器学习算法的研究文献,吸取其中的算法选择和结果解释性分析的宝贵经验,为后续本文研究奠定基础;(3)理论基础部分阐释本文研究方法的理论基础,主要简述了十种本文所用的机器学习算法背后的数理逻辑及用以对比研究的传统线性回归模型的理论依据,为实证研究打好基础;(4)实证分析部分首先简述数据选取的规则,并对其进行描述性统计,然后采用十种机器学习模型及多元线性回归模型对城投债利差变动进行建模及预测,最后对各种模型的预测结果进行评价并横向对比分析;(5)结论和局限性部分阐明了本文的核心结论,以及对相应的政策建议,并指出本文研究的局限性,为后续相关研究提供指引。
通过本文的实证研究,可以得出以下结论:(1)在优先考虑更高的投资胜率的情况下,XGBoost是最优模型,若部分机构投资者有大额持仓的需求可以考虑召回率更高的随机森林算法,同时大部分机器学习模型预测效果都优于多元线性回归模型;(2)中国宏观经济指标对城投债利差变动具有很强的预测重要性,但部分指标如M2和CPI两指标对利差变动的影响方向较为复杂;(3)地方宏观经济因素与发行主体相关因素的预测重要性较弱;(4)发行债项相关因素的预测重要性较强,银行间市场上市的、发行规模大的、发行期限短的城投债其利差更可能在未来收窄。
由于城投企业独特的历史沿革,其企业信用与地方政府信用有着千丝万缕的联系,导致城投企业及城投债需要国家和地方政府进行监管,在城投企业大规模转型的当下,为防范城投债暴雷引发系统性金融风险,保障投资者权益,本文提出如下几点建议:(1)继续贯彻“15号文”思想,重点杜绝虚假化解地方政府隐性债务;(2)加强外部评级机构评级的客观性与准确性,规范评级市场;(3)规范健全城投企业信息披露机制,促进城投债市场化定价机制建设与推进。