关键词:
土壤重金属污染预测
BP神经网络
随机森林
支持向量回归
自组织特征映射神经网络
数学分析
摘要:
土壤重金属污染威胁人类健康,然而传统的土壤重金属污染探测手段成本高、效率低,且收集的土壤重金属样本元素数据缺失问题较为严重,生态环境领域的缺失值补充方法精度低且局限性高。为解决以上问题,本文将机器学习算法引入到土壤重金属污染预测中,构建区域土壤重金属污染预测模型。以我国华北平原的某区域为研究区,收集该研究区2020年度的8类土壤重金属数据,利用这8类土壤重金属数据对研究区进行系统的评估。主要的研究工作如下:1.提出了利用机器学习对样本数据缺失值插值的方法,构建了基于改进BP神经网络的土壤重金属缺失值插值模型,从而对缺失的土壤重金属元素Cd、Hg、Pb进行预测。为了改善传统BP神经网络的不足,通过使用模拟退火算法优化果蝇算法,使用优化后的SA-FOA算法(模拟退火算法优化果蝇算法)代替传统BP神经网络中参数寻优的方法。对比传统BP神经网络算法,本章提出的SA-FOA-BP神经网络模型的预测误差有近10%的减少。2.提出了利用小样本数据预测区域土壤重金属污染的方法,构建了基于RF-GA-SVR(随机森林-遗传算法-支持向量回归)的土壤重金属污染预测模型。通过随机森林算法对土壤中重金属含量进行特征提取、特征训练,得出土壤重金属污染状况分类结果,将随机森林特征选择优化的结果输入到支持向量回归模型中,再使用遗传算法对支持向量回归模型参数进行优化,进而对土壤重金属污染进行预测。3.构建了基于改进自组织特征映射神经网络的污染源分类模型。以研究区的土壤重金属数据为基准,结合相关文献以及研究区地形数据,使用相关分析以及主成分分析对土壤样本中8种重金属元素进行分类,通过改进PCA-SOM算法(主成分分析-自组织特征映射神经网络)对以上重金属进行溯源分析,找出各类重金属的污染源头。综合土壤重金属缺失值插值方法、土壤重金属污染预测方法与土壤重金属污染源分类方法,构建区域土壤重金属污染预测模型。通过实际研究区数据验证,表明区域土壤重金属污染预测模型具有较高的研究意义和实用价值。