关键词:
违约判别
样本处理
模型赋权
小企业风险
大数据
摘要:
企业违约判别是构建企业的财务指标、非财务指标、宏观指标等指标数据和违约状态之间的规律性的函数关系,用以判别企业的违约状态。其目的是降低银行等金融机构为企业提供贷款时面临的信用风险。本研究针对小企业的违约判别问题建立了一个判别模型,以中国某商业银行的小企业数据为例进行实证并对华东数控公司做了微型案例的分析,分析了该企业在现金流量、营运能力等方面存在的问题并提出了相应的建议。本研究包括五章内容:第一章是绪论。第二章是违约判别模型的构建,第三章是基于中国小企业数据的实证研究,第四章是模型在华东数控公司中的应用,第五章是结论。本研究的研究重点有二:一是非平衡样本数据的处理。无论何种方法,何种模型,都对样本有较强依赖性,这也是数据驱动的共同特点。因此样本处理不好,用什么方法处理模型都会产生较大误差。二是多个判别模型的赋权方法。在基于多模型的违约判别模型中,每个模型的权重不同,判别结果不同,甚至截然相反。具有相似特点的样本训练出来的违约判别模型具有较高的判别精度。客观上,必然存在一组权重向量,使多个判别模型赋权后的违约判别模型判别精度得到提升。本研究通过对样本进行聚类后,建立了k类判别模型,通过将k个模型的判别结果进行加权平均、得到了对新客户的判别结果。本研究的主要创新:一是在处理非平衡样本时,先用k-means方法对客户进行聚类之后对每一类中的样本进行平衡处理(SMOTE),保证了通过相近的样本处理,得到了相近的平衡样本。用相近的平衡样本训练模型,保证了平衡样本与模型的一一对应关系,有助于提高单个模型的精度。二是在多个模型的赋权方法上,本文的处理方法是计算新客户到每一类样本聚类中心的欧氏距离,欧氏距离越小,基于该类样本训练的模型权重越大,反之越小。保证了用相近的平衡样本训练出的模型权重大,提高了判别精度。小企业的实证研究表明:本研究提出的模型的违约判别精度比支持向量机、决策树、K近邻等五种大数据模型高。研究发现:在中国小企业公司违约判别的指标体系中,“恩格尔系数”、“经营活动净现金比率”、“资本固定化比率”等25个指标为中国小企业违约判别的关键指标。“恩格尔系数”、“经营活动净现金比率”、“资本固定化比率”、“EBITDA利润率”“股东权益比率”5个指标最重要,这5个指标的个数虽然仅占全部指标个数的20%,但它们的重要程度却占全部指标的54.4%。