关键词:
岩石力学
PCA算法
CBLOF算法
SVMSMOTE算法
岩爆
数据处理
机器学习
摘要:
为降低岩爆样本数据中特征参数的相关性、剔除各类数据中的离群点和平衡数据集中各类岩爆等级的数量,提升岩爆数据库质量,提出一种PCA(principal component analysis),CBLOF(cluster-based local outlier factor)和SVMSMOTE(support vector machine synthetic minority over-sampling technique)组合算法的方法。首先收集国内外343组岩爆案例构建原始岩爆数据集,使用PCA降维方法对原始岩爆数据集样本进行降维处理,CBLOF算法剔除各类岩爆等级中的离群点,SVMSMOTE算法在各岩爆等级边界附近合成新的少数类样本,最后将处理后的岩爆数据库和原始岩爆数据库分别加入6种机器学习算法模型进行训练,验证PCA,CBLOF和SVMSMOTE算法组合的有效性。结果表明:经过PCA,CBLOF和SVMSMOTE算法组合处理后的数据库所训练的Ada Boost,CatBoost,LightGBM,GradientBoosting,ExtraTrees和Random Forest算法模型的准确率,相比于原始岩爆数据库样本所训练的算法模型准确率分别高29%,28.5%,34%,28%,26.5%,24%。因此,基于PCA,CBLOF和SVMSMOTE组合算法对岩爆数据库进行数据处理,能有效提升岩爆数据库质量,改善机器学习预测模型的性能。