关键词:
复杂网络
二分网络
社团结构
重叠节点
模块度
摘要:
随着对复杂网络的物理结构和功能特征的深入研究,研究者们发现许多复杂网络都具有社团结构的特征。近年来,社团结构检测方法研究已成为复杂网络中热点研究问题之一。研究发现复杂网络中社团之间又存在重叠现象,且复杂网络中节点类型又具有二分特性。但是,目前常见的单分网络社团结构检测算法往往存在着复杂度较高、准确率较低或者无法检测重叠社团结构等问题;现有二分网络社团结构检测算法通常是将二分网络投影为单分网络,投影过程中会造成信息丢失等问题。为此,本文对单分网络和二分网络的重叠社团结构检测进行了深入研究,主要工作及创新点如下:
(1)提出了一种基于核心节点和亲密度的重叠社团结构检测算法。
利用单分网络中节点类型唯一的特性,且存在着度值较大的节点,该算法率先引入核心节点概念。根据核心节点的特征从单分网络中抽取出核心节点,通过计算亲密度函数逐渐扩大核心节点这些初始社团,最终实现在单分网络中进行重叠社团结构检测。实验结果表明,该算法能够在较低的运行时间内完成重叠社团结构检测工作;根据模块度函数可获得准确度较高的重叠社团结构,符合现实复杂网络的实际社团结构特征。
(2)提出了一种基于扩展模块度的重叠社团结构检测算法。
由于传统层次聚类算法和分裂算法都具有较高的时间复杂度,又根据有权网络的结构特征,该算法首先提出了基于节点度值的种子社团概念,并给出了基于节点度值的种子社团所具有的特点。为了判断种子社团与其邻居节点之间的连接程度,又提出了吸收度函数。该算法的主要步骤是从单分网络中抽取出种子社团,再根据吸收度函数逐步扩大种子社团,从而得到基于节点度值的重叠社团结构。该算法分别在计算机生成网络和几个现实网络中进行了测试实验,实验结果表明该算法能够较准确地检测到重叠社团结构;将该算法与现有几种算法进了计算性能的比较,表明了该算法能够在大型复杂网络中较准确地检测出重叠社团结构。
(3)提出了一种基于极大完全子图的重叠社团结构检测算法。
根据现实复杂网络中可能包含大量极大完全子图、且又局部具有星型耦合网络结构特征,提出了一种基于极大完全子图的重叠社团结构检测算法。该算法首先通过深度与宽度搜索方法从单分网络中抽取到极大完全子图,再根据给定规则合并相邻的极大完全子图,最后通过扩展模块度函数判断社团结构检测结果。实验结果表明,该算法可以在较短的运行时间内保证重叠社团结构检测的准确性;同时也能够检测出重叠节点、链桥节点和孤立节点等具有特殊结构特征和功能特性的节点。
(4)提出了一种基于极大完全二分子图和二分聚类系数的重叠二分社团结构检测算法。
在二分网络中含有两种不同类型的节点,且连边只存在于异类节点之间。利用某种投影方法可以将二分网络投影为单分网络,但鉴于投影过程中都会造成某些信息丢失、边数剧增以及产生冗余信息等问题,提出了一种直接在原始二分网络中进行二分社团结构检测的算法。算法首先给出极大完全二分子图和二分聚类系数等相关概念。本算法包括两个主要步骤:1)根据极大完全二分子图的结构特征从二分网络中抽取出极大完全二分子图;2)根据二分聚类系数函数阈值合并相邻的极大完全二分子图。实验结果表明,当二分模块度函数处于某个极大值点的时候,该算法可以准确地检测到原始二分网络的重叠二分社团结构。
本文针对单分网络重叠社团结构检测提出的三种算法适用范围各不相同。其中,基于核心节点和亲密度的重叠社团结构检测算法适用于对含有度值较大节点的单分网络进行重叠社团结构检测;基于扩展模块度的重叠社团结构检测算法适用于对有权单分网络进行重叠社团结构检测;当单分网络中含有大量极大完全子图、且又局部具有星型耦合网络结构特征,采用基于极大完全子图的重叠社团结构检测算法进行重叠社团结构检测效率更高。
本文得到国家自然科学基金(61370145,61173183,60973152),高等学校博士点专项科研基金(20070141014),辽宁省高等学校优秀人才支持计划资助(LR2012003),辽宁省自然科学基金(20082165),中央高校基本科研基金(DUT12JB06)的联合资助。