关键词:
社团结构
社团特征
静态社团检测
局部社团检测
动态社团检测
摘要:
生产生活中存在大量的复杂系统,人们常用复杂网络来表示这些系统,通常可将复杂系统抽象为一个静态的网络来表示其信息,而复杂系统经常随着时间和空间的变迁而演化,从而生成动态网络。随着信息技术的高速发展,人们迫切需要更深入地挖掘这些网络内部潜在的结构特征,从而对复杂系统的功能进行探索。从这些复杂网络中挖掘有用的信息,已成为推动相关领域技术发展的重要任务。社团结构挖掘就是以静态或动态网络为研究对象,从其中检测特定的模块,这些模块内部链接相对稠密,而模块之间链接相对稀疏。系统的功能与其结构关系密切,检测网络中的社团结构对系统的功能分析有着重要的指导意义。因此,近年来,社团检测引起了众多学者的关注,针对大规模网络的社团检测和随时间演化的动态网络中的社团检测更是目前的研究热点。已有的社团结构检测方法从不同的视角对社团检测问题进行了研究,社团检测技术有了长足的进展,已有大量的文献报道了不同的检测算法。有些算法具有较好的性能,但同时存在诸多不足,尤其是针对大规模网络及动态网络,其检测效果仍然不尽人意,有待进一步深入研究。基于社团的特征,本文开展了静态网络、动态网络和局部网络上的社团检测技术研究。具体而言,本文的主要研究内容及创新包括以下三方面:1.针对静态网络,提出了两种社团检测算法:1)基于社团内在特征的检测算法Intrinsic-prop,该算法不仅考虑了每个结点和其直接邻居的关系,而且同时考虑了结点与其二阶邻居的关系,从这些邻居中选择与其联系紧密的结点共同组成社团中心,并提出了加入社团的成员必须满足的条件,进而对社团进行扩张与合并,得到最终的社团结构;2)基于结点相似性和社团链接强度的检测算法NSCLS,该算法首先提出了一种结点相似性的计算方法,基于结点相似性进行社团初始化,而后提出计算社团间链接强度的方法,根据链接强度合并某些社团,得到最终的社团结构。算法Intrinsic-prop的检测结果中,两个互为邻居且具有较多共同邻居的结点位于同一社团,每个结点都与其较多的邻居拥有相同的社团归属。在NSCLS的结果中,每个结点都和自身最相似的邻居结点归属于同一社团。这些特征保证了社团结构的质量,这两种算法在人工合成网络和实际网络上都取得了较好的结果,验证了算法的有效性。2.基于局部簇及局部模块度的局部社团检测算法3L。该算法提出了一种局部社团检测框架,仅使用网络的局部信息进行单个社团的检测。该算法首先获得包含给定结点的核心簇,然后确定围绕核心簇的一系列外围簇,确定局部社团所在的大致范围,进而考虑簇和簇之间的关系,得到最终的局部社团。该算法对起始结点的选取并不敏感,缓解了起始结点位于社团边界时一些算法无法有效地检测目标社团的问题,该算法适用于规模较大或全局信息无法获取的网络。通过实验表明,3L算法能够得到较好的局部社团检测结果。3.模拟蛛网演化的动态社团检测算法Spiderweb。该算法以增量方式进行动态社团检测,首先使用Intrinsic-prop算法检测第一个快照上的社团结构,然后通过模拟蛛网变化过程对结点和边的增加及删除事件进行处理,以增量方式确定后续快照上的社团结构。该算法不仅得到了每个快照上高质量的社团结构,而且保持了相邻快照上社团结构的平滑过渡。通过在大量的人工合成网络及实际网络上进行充分的实验,证实该算法检测效果稳定,其适用性及检测结果的质量均明显优于对比算法。综上所述,本文提出的Intrinsic-prop、NSCLS、3L及Spiderweb算法可以分别从静态网络、动态网络上检测出高质量的社团结构,它们为复杂网络中的社团检测问题提供了可行的解决方案,也为复杂网络的其它链接挖掘任务提供了研究基础。