关键词:
热带气旋生成频数
热带气旋强度突变
多元线性回归
随机森林算法
摘要:
热带气旋是影响我国的主要灾害性天气系统之一。提高热带气旋的研究和预报水平,对我国经济发展和国防建设具有重要意义。近些年,对于热带气旋路径的客观预报水平有了显著的提高,但其强度预报提升幅度较小。生成频数等长期变化预测不确定性依然很大,目前仍是学者们关注的重点。影响热带气旋生成频数的物理机制复杂,2018年8月共有9个热带气旋生成,相比气候态数量明显偏多。本文利用统计分析方法,对影响显著的物理因子进行分析,表明2018年8月相关区域850 h Pa相对涡度与多年平均值最大正距平达0.25×10-4/s,600 h Pa相对湿度高于多年平均值8%-10%,成为生成频数异常偏多的主要原因。这和西北太平洋副热带高压位置特征、北印度洋至我国南海大范围海域西风异常、南海海域经向风异常、水汽通量异常,以及季风槽的位置相关。本文通过对1979-2018年强度突变热带气旋统计分析,发现热带气旋最易发生快速增强的区域为15°-20°N、125°-135°E之间的菲律宾以东海域。在此区域中挑选出快速增强的热带气旋,首次利用逐小时分辨率海温数据,采用海温区域累积的方法,发现该海温数据在其对强度影响的研究时更具有优势,和强度的相关系数超过0.94。区域累计是研究海温和强度关系的工作中更合理的方法。区域累计海温值相比中心瞬时海温值和中心风速的相关关系更好,相关系数达到0.8以上,可应用到其他物理因子的分析中。基于美国NCEP/NR1再分析数据,提取热带气旋经过区域的大气因子、海洋因子、下垫面因子,以及气旋自身位置、移速等物理因子,并将上述因子的过去12小时变化量共同作为自变量,采用多元线性回归方法建立热带气旋强度统计预报模型,选择美国NECP/GEFS预报数据,对2016年所有热带气旋及强度较强气旋的强度及未来12小时中心最大风速变化值进行预报,并与GEFS预报结果对比。统计模型对热带气旋中心最大风速的预报效果优于GEFS结果,尤其对极值的预报更准确。相关系数超过0.5,均方根误差最大可减小7-8m/s。应用随机森林算法,用同样的数据资料对热带气旋强度预报进行学习,来考察该机器学习方法的适用性,尝试对数值预报结果进行改进。发现随机森林的机器学习方法对于热带气旋强度的预报能力较好,均较GEFS结果有所改善。随机森林机器学习方法对于热带气旋未来12小时变化预报的均方根误差大多保持在6-7m/s之间,相关系数达到0.6。对风速的预报结果相关系数为0.5-0.6,均方根误差最大可减小6-7m/s。为对比机器学习方法和统计方法的预报效果,选取2015-2016年热带气旋强度为样本数据,对2018年热带气旋24、48、72小时强度开展预报。结果显示统计模型和机器学习对2018年24小时、48小时及72小时风速变量的预报结果相对GEFS预报结果均有很好的改善,其中机器学习的效果优于统计模型回归拟合的效果,但最终的预报误差均为统计模型略偏小。将机器学习方法和统计模型相融合后,24小时及72小时预报效果改进更为明显。在风速变量24小时预报中,最优预报结果相比较GEFS预报结果提升44.6%;在风速变量48小时预报中,最优预报结果相比较GEFS预报结果提升31.9%;在风速变量72小时预报中,最优预报结果相比较GEFS预报结果提升26.9%。分析发现,半径、初始风速、500h Pa涡度、200h Pa散度、相对湿度以及与海温相关的因子为影响热带气旋强度最高的因子,这些因子通过影响积雨云的维持和热量的释放,影响气旋内部和外界的质量输送,从而影响水汽、热量的来源以及气旋暖心结构,最终影响热带气旋的强度。预报误差主要由热带气旋预报位置偏差、影响因子值大小和空间分布的预报偏差造成。