关键词:
库岸滑坡
成因机制
机器学习
点预测
区间预测
摘要:
我国三峡库区山地丘陵广布,地质条件复杂,加之雨季降雨量较为丰富,是典型的库岸滑坡高发区。受库水位高程变动及周期性强降雨的影响,该地区存在大量具有“阶跃”变形特征的新老滑坡,即在一个周期内长时间保持平稳变形,某一时刻变形突然加剧,而后又恢复稳定。对滑坡进行预测预报作为灾害防治的有效手段之一具有十分重大的工程意义,机器学习是一种使计算机模仿人类大脑进行运算的智能模型,将其与工程实际进行结合是目前各个领域的研究热点,已被成功应用于滑坡位移的预测方向。模型输入与输出数据间的相关性程度决定着其预测性能的优劣。因此,本文以白家包滑坡为例,对其变形机制和诱发因素进行了详细分析,并提出一种基于机器学习方法的位移点预测模型,随后又在此基础上提出了两种分别适用于不同规模样本的区间预测模型,以此量化点预测过程中存在的不确定性。本文重点做了以下工作:
(1)结合现场工程地质资料及相关监测数据对白家包滑坡成因机制进行分析,重点分析了影响滑坡变形的内部控制因素和外部诱发因素。结合位移监测资料对滑坡的变形特征进行阐述,并深入探讨变形特征与影响因素间的响应关系。
(2)基于白家包滑坡ZG326监测点历史监测变形数据,采用变分模态分解法(VMD)将具有“阶跃”变形特征的位移进行分解,得到多个具有不同变形特征的位移分项。然后利用模糊C均值聚类法(FCM)将多个分项进行聚类得到具有实际物理意义的随机项、波动项和趋势项位移。在三组位移分项与初设影响因子间建立灰色关联度模型,根据相关性系数为每个位移分项选择有效影响因子。将有效影响因子作为输入数据,相应的位移分项作为输出数据建立贝叶斯优化的最小二乘支持向量机(Bayes-LSSVM)进行训练及预测。叠加位移分项预测值得到总累积位移的预测值。将上述模型应用于ZG323、ZG324和ZG325监测点的位移预测中,根据预测结果对所提方法的适用性进行验证。随后将上述模型与六种不同模型的预测结果进行对比,体现了所提模型的优越性。
(3)为解决传统点预测方法无法对滑坡位移预测过程中的不确定性进行量化的问题,提出一种适用于小样本数据的区间预测方法。首先采用不同的Bootstrap抽样方法对各位移分项数据集进行抽样,得到多组伪数据集,分别针对每组伪数据集建立相应的预测模型,计算得到预测区间。将基于不同抽样方法得到的预测区间进行对比,由此为每个位移分项选择最优抽样方法。利用各个位移分项的最优抽样法进行抽样预测,得到位移回归均值及系统误差方差。然后将所有的有效影响因子作为输入,模型的平方残差序列作为输出,建立蝙蝠算法优化的核极限学习机(BA-KELM)进行训练预测得到随机误差方差。将点预测值与上述两种误差的方差结合得到位移的预测区间。同样将所提方法应用于其他三个监测点,得到的预测区间表现均较好,表明模型适用性较高。然后将所建模型与其他两种不同模型的预测结果进行对比,从而验证所提模型的优越性。
(4)上述Bootstrap法对小样本数据适用性较强,预测结果的可靠度较高。但当样本规模变大时,该方法计算成本大幅增加,明显不再适用。因此提出一种适用于大样本数据的区间预测方法。将原始数据集划分为训练集、误差生成集和预测集,采用训练集对上述点预测模型进行训练,并根据训练后的模型对误差生成集进行预测,计算得到各点预测误差。由于单个监测点生成的误差数量较小,本文采用同样的方法对与ZG326具有工程相似性的ZG323、ZG324和ZG325监测点进行点预测,并将得到的预测误差作为原始预测误差集的补充数据,以此满足大样本条件。分别利用参数法和非参数法对误差分布的概率密度函数进行估计,计算得到不同的预测区间。通过差分进化算法将基于两种方法得到的预测区间进行加权组合,获得同时满足较高覆盖率和较窄宽度的高性能区间。同样地,利用该方法构建其余三个监测点的组合预测区间,根据预测结果验证本文模型的适用性。