关键词:
手足口病
流行病学
预测模型
SARIMA
SVR
WNN
ELM
NAR
摘要:
目的:分析2007-2016年我国手足口病(HFMD)的流行特征,探讨SARIMA模型、SVR模型、WNN模型、ELM模型及NAR动态神经网络在HFMD发病率预测中的效果。应用MAE、RMSE和MAPE等指标,评判预测模型拟合程度,并筛选出最优预测模型,因而丰富了传染病预测模型的方法研究,为我国HFMD预警政策拓宽了新思路。方法:通过国家科技基础条件平台、国家人口与健康科学数据共享平台公共卫生科学数据中心、国家卫生健康委员会疾病预防控制局公布的全国法定传染病疫情报告获取2007-2017年我国HFMD数据。使用Excel 2013和ArcGIS 10.2软件,描述其时间分布、地区分布、年龄构成及职业构成等流行特征,并建立SARIMA模型、SVR模型、WNN模型、ELM模型和NAR动态神经网络。通过MAE、RMSE和MAPE等指标来评价模型的优劣,评判预测模型的效果。若指标值均较小,则说明预测较优。应用EViwes 8.0软件建立SARIMA模型;应用MATLAB 2017a软件libsvm工具箱建立SVR模型;应用MATLAB 2017a软件建立WNN和ELM模型;应用MATLAB 2017a软件GUI工具箱建立NAR动态神经网络。结果:(1)2007-2016年我国HFMD累计报告病例15297683例,年平均发病率为120.9880/10万;死亡病例3554例,年平均死亡率为0.02646/10万。我国HFMD发病呈双高峰分布且存在明显的季节性和周期性趋势,5-6月份发病率最高,2月份最低。海南省(373.1988/10万人)和广西壮族自治区(343.5753/10万人)年均发病率最高。我国HFMD的高发人群是0-5岁儿童(占94.2669%),且主要是散居儿童,发病例数为10236345例,高达73.67%。(2)我国HFMD月发病率SARIMA预测模型表达式为SARIMA(3,1,3)(1,1,0)12,模型各参数均有统计学意义(P<0.001);SARIMA模型预测的2017年HFMD月发病率与实际值相比,评估指标MAE、RMSE、MAPE分别为3.5149、4.8827和26.1709%。(3)我国HFMD月发病率建立的SVR模型中采用前5年历史发病率数据作为样本输入,当前发病率数据为样本输出;最佳的参数c和参数g分别为11.3137和0.0221。SVR模型预测2017年HFMD的月发病率与实际值相比,评估指标MAE、RMSE、MAPE分别为2.8795、4.0743和24.9287%。(4)我国HFMD月发病率建立的WNN模型中网络结构以前5年历史发病率数据作为网络输入,当前发病率数据为网络输出,隐含层节点数为3。WNN模型预测2017年HFMD的月发病率与实际值相比,评估指标MAE、RMSE、MAPE分别为2.4371、3.7155和23.5869%。(5)我国HFMD月发病率建立的ELM模型中网络结构以前3年历史发病率数据作为网络输入,当前发病率数据为网络输出,隐含层节点数为15。ELM模型预测2017年HFMD的月发病率与实际值相比,评估指标MAE、RMSE、MAPE分别为2.1304、2.8234和20.9452%。(6)我国HFMD月发病率建立的NAR动态神经网络,采用LM算法进行网络学习,样本数据分配比例为:训练集80%,验证集10%,测试集10%;隐含层神经元个数为8,延时变量数为12。NAR动态神经网络预测2017年HFMD的月发病率与实际值相比,评估指标MAE、RMSE、MAPE分别为2.5071、3.8756和20.9665%。结论:(1)在我国HFMD发病具有明显的季节性趋势,并呈双峰分布,第一个发病高峰始于每年4-7月份,且5月份最高,第二个发病高峰则出现在每年的9-10月份。2007-2016年,10年间年平均发病率最高的地区以海南省和广西壮族自治区为主。我国HFMD高发年龄为0-5岁,集中于散居儿童和幼托儿童。(2)SARIMA(3,1,3)(1,1,0)12模型、SVR模型、WNN模型、ELM模型和NAR动态神经网络均适用于我国HFMD发病率的拟合和预测。(3)我国HFMD月发病率的预测模型中,综合比较ELM模型、NAR动态神经网络、WNN模型、SVR模型、SARIMA模型,ELM模型为最佳模型。