关键词:
NFV网络
多层网络管理
故障检测
数据处理
时间序列
摘要:
5G技术的出现以及用户对网络服务质量等方面日益严格的要求,推动了传统电信业务提供商的技术变革,网络功能虚拟化(Network Function Virtualization,NFV)技术应运而生。NFV是5G应用与发展的核心技术,它实现了网络软件与硬件设备的解耦,分离了网络功能层与专有硬件层,将传统电信网络抽象成为由虚拟网络功能(Virtual Network Function,VNF)层和基础设施(NFV Infrastructure,NFVI)层构成的多层网络,从而可以在统一管理的虚拟资源之上灵活部署各种VNF。这一技术减少了业务提供商在大型物理基础设施上的支出以及维护、升级、修理所耗费的时间与金钱成本,但也让NFV网络具有了高动态性、层间不可见性、网络组件复杂性等特点,上述特点给NFV网络的故障管理带来了极大挑战。
NFV要求高效和灵活的网络管理,其中依靠人工智能技术的自动化监控已经成为管理未来网络的共识。NFV网络中的故障主要发生在虚拟机(Virtual Machine,VM)和硬件设备中。对NFV进行故障诊断时,需要从海量数据中迅速识别性能正在降低的VNF、VM或硬件设备,以尽快恢复网络的正常运行。本文使用逐层处理策略检测NFV网络故障,以解决VNF层网络信息对NFVI层不透明的问题,主要内容如下:
(1)NFV网络故障诊断模型与算法综述。系统分析了NFV多层网络的特性所带来的网络故障管理问题,在此基础上阐明本文的选题意义,提出了NFV网络故障管理的改进方向。然后针对现有的NFV故障诊断方法,总结归纳了各类方法的优缺点。
(2)NFV网络架构概述与故障数据预处理。介绍了NFV多层网络的整体架构,并讨论了NFV产生的故障数据类型。然后针对NFV中每层网络的特点,选择不同方法对收集到的原始监测数据进行了预处理,删除识别到的无关特征变量。此举提高数据集的质量,降低了后续模型学习的时间成本。
(3)NFV网络的VNF层(上层)故障检测算法研究。针对VNF层上任务分配的高动态性,保留数据的时序性特征,使用动态时间扭曲方法衡量两个时间序列之间的相似度。通过训练正常状态下的历史时间序列,得出VNF服务处于正常情况下两个时间序列之间的相似度,在训练完成后使用统计方法为不同VNF设定相应的故障阈值。在故障实时检测阶段,对未知输入序列进行相似度计算,并使用基于滑动窗口的方法对VNF层服务进行故障诊断。仿真结果表明,对于VNF层不同的服务类型,该故障检测算法均可达到一定准确度和效率。
(4)NFV网络的NFVI层(底层)故障检测算法研究。针对NFVI层故障发生位置的多样性设计了故障检测算法,对主机故障、VM故障、主机间链路故障、主机与VM之间的故障进行了全面的检测。主要基于极端梯度提升方法构建NFVI层的故障检测模型,改进了方法的损失函数以优化模型的节点划分过程,并结合交叉验证与网格搜索方法调整参数以优化学习模型。大量的仿真实验表明,该算法与现有的NFVI层故障检测算法相比,在准确率、均方误差、训练时间等性能上均有明显的提升,可对NFVI层发生的故障进行有效地检测。