关键词:
手足口病
分布延迟非线性模型
百度指数
摘要:
手足口病是一种多发生于5岁以下婴幼儿的常见流行病。近年来,手足口病的预防控制工作越来越受到政府相关部门的高度重视。在传统疾病监测体系中,官方数据一般会在疾病发生后的两周后才会发布,这给疾病监控的实践工作带来一定的挑战。随着互联网技术的发展,我们的生活与互联网息息相关,以搜索引擎数据为代表的互联网数据在各个领域的研究中发挥了重要作用。互联网数据具有及时性和低成本的特点,在疾病监测中具有独特的优势。本文利用爬虫技术获取2014年-2015年内江苏省13个地级市特定关键词的百度指数,以日为采集单元,将这些关键词的百度指数处理统一后形成综合指数来刻画互联网数据。利用时空立方体技术,对江苏省手足口病发病情况的时空分布进行可视化分析,有利于探究江苏省手足口病的流行趋势规律。结合聚类技术,将江苏省分为两个区域,手足口病高发区和手足口病低发区。对两个区域的研究结果进行分析比较,探索不同发病强度的区域中互联网数据与手足口病发病率的关联性特征。利用非参数方法对数据进行去噪,降低数据噪声的影响。最后进行分布延迟非线性建模,同时考虑互联网数据与手足口病数据的非线性关系以及滞后效应。本文探究江苏省手足口病的流行病学规律,研究互联网数据与手足口病数据的关联情况,将互联网数据作为手足口病流行趋势的早期预警信号,有利于建立基于互联网大数据的流行病实时监控系统,提高政府相关机构对公共健康的管控和决策能力。