关键词:
网络可视化
网络压缩
聚类
社团检测
重叠社团
幂图
摘要:
近年来,复杂网络分析研究表明大量现实网络如社交网络、交通运输网络、引文网络、蛋白质网络、规则关联网络等具有非平凡的拓扑特征。复杂网络分析的主要目标是检测并发现这些结构以有利于人们理解其中蕴含的规律。网络可视化是实现上述目标的重要支撑技术,也是信息可视化的分支研究领域。快速、高效地、多尺度地可视化这些网络拓扑,降低研究复杂性,以供网络分析专家高效浏览并直观发现网络中隐含的规律或趋势,已成为当前重要的研究课题。随着网络规模的快速膨胀,网络结构复杂多样,传统网络可视化方法已经难以满足实际需求。为此,本课题致力于大规模网络的可视化技术研究,将其分解为“网络结构特征检测——网络结构展示”两个阶段,解决如下四个方面的具体问题:(1)大规模网络中重叠社团结构的快速检测;(2)网络拓扑中高阶依赖关系的检测和刻画;(3)大规模网络全局拓扑结构的多尺度展示;(4)局部高密度网络的精确展示。具体研究工作如下:1.针对现有重叠社团挖掘算法易将重叠区域错误地划分为独立的社团且计算复杂的问题,提出了一种基于局部信息度量的快速重叠社团挖掘算法。首先,为节点定义局部信息度量指标——社团连接度和邻居连接度,建模节点与社团的关系,缩小计算范围;然后,每次并行地迭代执行缩减、扩展、去重等操作,并更新局部度量指标,通过松弛每次迭代的终止条件,发现近似最优社团集合而不是最优社团,最终算法复杂度为O(7)m(10)n(8)。基于真实的大规模社交网络数据的试验分析表明:与当前流行的重叠社团挖掘算法相比,本文算法在不损失检测质量的前提下,大幅提升了计算效率。2.针对网络数据中高阶关联特性,设计了一种基于进化博弈理论的网络可视化聚类方法。首先采用超图描述网络内节点间的高阶关联特性,其次,将超图聚类的动态过程建模为进化博弈理论,证明了均衡点与优化问题解的一一对应关系,并推导出用于求解聚类的动力学方程,算法无需设定聚类的数目。人工和真实数据集相结合的试验表明:本文算法能够自动确定分簇数目,具有良好的聚类效果以及较强的鲁棒性。3.针对大规模网络全局结构多尺度展示的问题,提出了一种基于非重要节点拆分融合的网络层次压缩算法。该算法首先在定义节点块及其关系的基础上,给出了针对节点块的拓扑结构重要性度量方法;然后,利用资源分配和分流原理,提出了基于节点拆分的拓扑层次聚合机制;最后,通过将网络中每一层的非重要节点块拆分融合到与其相邻的节点块中,实现网络结构的快速压缩。与现有算法相比,本文算法效率较高,而且可以得到更加连贯的层次结构,从而更好实现多尺度展示。4.针对高密度网络中边的精确展示问题,提出面向强连接网络图的无损压缩算法,借助幂图分析技术,将所有具有相同邻居的节点集合汇聚成单个模块(modules)以大幅压缩网络图,连接到某个模块的一条边表明该边与模块内的所有元素都相连。从而,整个图均可以无损地可视化展示。首先,本文证明了含有单个模块的最优幂图问题为NP难问题,进而扩展一般地最优幂图分解计算为NP难问题;其次,在梳理现有整数线性规划模型和约束规划模型等问题的基础上,本文提出了基于回溯策略的波束搜索算法,以使有限的回溯策略提供启发信息,相较于已知启发式方法更快速地得到更优的结果;最后,通过生成的随机无标度图,验证了本文算法的有效性。