关键词:
臭氧浓度预测
机器学习
核极限学习机
支持向量机
小波变换
变量投影重要性指标
摘要:
近地面O3的生消是一个非线性、强耦合的过程。近年来,随着计算机技术的发展,机器学习等人工智能技术在解决非线性预测问题时表现出一定的优势。其中,核极限学习机(KELM)作为一种较新的机器学习方法,还尚未在大气环境领域得到较多的应用与比较评估。本研究基于2014~2016年夏季南京北郊工业区观测的O3、前体物及气象数据,主要开展以下两个方面的研究:第一,基于KELM的回归功能预测南京北郊工业区夏季O3小时浓度,并与逐步回归方法(SR)、支持向量机回归方法(SVR)和反向传播神经网络(BPNN)进行比较。同时,基于KELM的分类功能初探其在O3浓度超标问题的应用效果。结果表明:在回归预测问题中,KELM在3种机器学习方法中表现出最佳的预测性能,具有预测准确度高、学习速度快的优点,其预测值和观测值间的MAE、RMSE、NRMSE、R2和IA分别为10.43 ppb、13.48 ppb、16.18%、0.64和0.86。SVR和BPNN在预测问题上的表现基本一致,而SVR在RMSE、NRMSE、IA和学习速度上略有优势。在分类识别问题中,KELM-C1对O3浓度超标的预警准确率为90.63%,略高于SVC1。所有的“正常”情况均被准确判断。KELM-C2对O3最大8小时平均浓度超标的预警准确率为82%,与SVC2相差不大。第二,采用小波变换(WT)和基于最小二乘法的VIP值(PLS-VIP)这2种预处理方法,对KELM预测方法进行优化,并与SVR进行比较。结果表明:WT方法将具有较高可变性的O3原始时间序列分解为几个具有较低可变性的子序列,可以将O3浓度预测的准确性提高2.33%~21.82%不等。PLS-VIP方法用于各个层次的变量筛选,在保证预测精度的同时将输入变量的数目由14个减少到2~6个,并缩短了模型的运行时间。WT和PLS-VIP这2种预处理方法有效增强了原始模型对O3低、中、高浓度区间的预测能力,特别是空气污染预测重点的高浓度O3。经整体比较,基于KELM建立的模型的预测效果要比基于SVR建立的模型好平均5.91%,具有很好的应用价值。