关键词:
智能通信网络
网络认知模型
数据缺失填补
数据降维
数据异常检测
摘要:
人工智能技术与信息通信网络技术深度融合,推动网络向智能通信网络方向演进,支撑和满足“万物智联”需求。然而,现有研究大多局限于网络管控和网络运维等局部智能水平提升,或利用人工智能技术解决频谱资源紧缺和网络安全威胁等具体问题,导致网络智能化水平提升程度受限。提升网络智能化水平的研究焦点是网络如何更主动地认知环境资源,从而得到适应环境变化的最优策略。以OODA环(Observe,Orient,Decide and Act)为基础的认知方法可使网络具备认知能力,但其中涉及的知识缺乏实体以及实体与概念间关系,导致网络难以准确理解知识,主动认知环境的能力受限。因此,从知识入手研究基于OODA环的认知方法,增强网络对知识的理解,提升网络主动认知能力进而提升其智能化水平,具有重要的理论和实际意义。
课题以实现网络主动认知环境的关键技术为研究对象,重点研究网络认知模型构建与验证、对网络认知模型环境数据的高缺失率填补、降维和异常检测,保障网络认知模型高效稳定运行,实现网络主动认知环境,为提升网络智能化水平提供新途径。
首先,针对OODA环中缺乏实体及其与概念间关系的知识,导致网络难以理解知识的问题,引入知识图谱技术,提出以网络知识单元为核心的网络认知模型。该模型对OODA环的四个单元进行重组和优化,建立“多域感知”单元,将感知范围扩展至多域环境,并针对环境数据存在的高缺失率、高维和异常值等问题进行预处理,为知识生成提供准确有效的环境数据来源;基于机器学习等方法,建立“学习分析”单元,分析环境数据并提炼为网络知识;基于知识图谱技术,创新构建“网络知识”单元,将多域环境、决策方案等网络知识构建为知识图谱,为生成决策方案提供逻辑支撑,便于网络准确理解认知行为逻辑;建立“优化决策”单元,基于网络知识图谱,生成有效决策方案。内嵌网络认知模型的网络节点以分级分布的方式组网,主动认知并快速响应周围环境变化。网络认知模型从网络准确理解和快速响应动态环境的角度提高网络主动认知能力。
其次,受传感器性能限制以及环境动态多变影响,“多域感知”单元获取的环境数据存在缺失率较高的问题,导致“学习分析”单元分析环境数据的准确性下降。针对该问题,根据融合填补思想,提出基于聚类和生成对抗网络的融合方法,填补环境数据。分析环境数据缺失特征和填补需求,挖掘现有填补方法无法直接应用的问题:缺失率超过70%时填补精度下降。利用聚类和生成对抗网络的各自优势,提出两种融合方法:一是利用聚类降低数据稀疏度,提出“粗填补+精填补”融合方法,降低随机噪声矩阵中的噪声项,提高生成对抗网络填补精度。二是利用生成对抗网络提高数据完整性,提出“训练+应用”融合填补方法,避免聚类直接处理缺失数据时失效的问题,在提高填补精度的同时降低填补耗时。基于聚类和生成对抗网络的两种融合填补方法从数据完整性角度保障环境数据分析的准确性。
然后,“多域感知”单元感知范围扩大使得环境数据具有高维特征,需要感知大量的样本以避免维数灾难,而大量样本将增加“学习分析”单元分析耗时。针对该问题,基于特征筛选思想,提出基于信息熵低秩表示的UMAP(Uniform Manifold Approximation and Projection)降维框架。分析环境数据维度特征和降维需求,剖析UMAP降维方法无法直接应用的难点:小样本数据空间分布稀疏导致流形学习耗时增加。先利用低秩表示对数据去噪,提高降维鲁棒性。再设计信息熵加权阈值,保留重要特征,降低数据空间分布稀疏度,从而提高UMAP流形学习效率,在保证降维精度的同时,达到降低总耗时的目的。基于信息熵低秩表示的UMAP降维框架从数据可用维数的角度保证环境数据分析的时效性。
最后,受传感器性能和环境噪声干扰等影响,“多域感知”单元获取的环境数据存在全局、局部和集群异常值,影响“学习分析”单元的分析精度。针对该问题,提出基于核密度波动因子的孤立森林异常检测方法。分析环境数据异常特点和检测需求,确定孤立森林方法无法直接应用的问题:难以检测局部和集群异常。利用核密度波动因子计算数据在孤立树中的异常分数,刻画数据全局、局部和集群特征,将所有数据异常分数的均值作为阈值,从而确定全局、局部和集群异常数据。同时,针对核密度波动因子计算复杂度较高的问题,用数据在孤立树中的路径长度取代欧式距离,避免多次计算数据间距离,从而降低计算复杂度。基于核密度波动因子的孤立森林异常检测方法从数据准确性角度保证环境数据分析的精度。