关键词:
QAR数据
置信水平
航段油耗
统计学
深度学习
区间预测算法
摘要:
随着国际航空碳抵消及减排机制这一全球性行业市场减排机制的稳步推进,国内也会逐步开放航空碳排放交易市场,在进行航空碳核查时需要判断航空公司所报告的油耗数据是否合理可靠,而进行数据合理性判断的关键在于实现航空合理油耗数据的区间估计并且确保预估结果的可靠性以及算法性能足够好,在航段油耗区间估计这一应用场景下,预估的区间覆盖率越接近期望值且区间长度越短表明预估结果越可靠合理、算法的可靠性越高;不同次训练得到的结果差异性越小,算法稳定性越高;不同数据量、数据分布的样本,算法均能实现可靠的估计,算法普适性高。因此,本文对航段油耗区间预估算法进行研究,对各算法性能进行评估比较,确定综合性能最优的算法。首先通过对快速存取记录器(Quick Access Recorder,QAR)数据进行数据处理,得到了能用于区间预估模型构建以及区间预估算法性能分析比较的初级数据源,得到的初级数据源能够很好地等效于航空公司所上报的数据,作为一种交叉验证数据源。然后对航段油耗数据分布情况进行了分析,提出了两种基于数据分布的统计学区间预估算法以及一种不基于数据分布的统计学区间预估算法,从理论上分析了三种算法的算法性能。接下来对深度学习区间预测算法进行了研究,将两种深度学习区间预测算法应用到了航段油耗区间预测,研究了数据预处理以及损失函数对算法可靠性、稳定性的影响。根据航段油耗数据自身特点,对深度学习高质量区间预测算法进行了算法改进,提高了航段油耗区间估计这一场景下算法的可靠性、稳定性、普适性。最后进行了算法性能分析比较实验,实验结果表明基于分位数的区间预估算法以及航段油耗深度学习高质量区间预测算法综合算法性能最优,能够实现在给定置信水平下准确合理航段油耗区间估计,能够用于现阶段的航空油耗碳核查。航段油耗深度学习高质量区间预测算法还能在多影响因素下实现区间估计,预测区间长度明显减少,算法性能综合最优,未来可以用于引入更多影响因素的航空油耗碳核查。