关键词:
社团检测
局部扩展
高阶结构
关系强度
中心性度量
摘要:
现实中的很多复杂系统可以被抽象为复杂网络。社团是复杂网络中重要的结构特征。社团内部的节点彼此连接紧密,而不同社团之间连接稀疏。研究复杂网络的社团结构特征对于探索和揭示复杂系统的功能特性具有重要意义。目前社团检测算法的研究已经取得了长足的进展,但同时也存在很多不足之处。其中,在基于种子的局部社团检测方法中,种子节点选取方式、社团扩展方式以及社团边界节点处理方式还需要进一步研究。本文使用邻居间结构特征来检测社团,主要的研究内容包括以下两个方面。针对网络中连接紧密且相似度高的邻居节点不能合理划分到相应社团的问题,本文提出了一个局部视角下基于高阶三角形的社团检测算法LEHT。该算法首先依据节点与其邻居节点之间的局部关系,为每个节点依次构建高阶三角形。若该节点与邻居节点构成多个高阶三角形时,使用本文定义的三角形相似度计算该节点构建的高阶三角形的稳定性,选择稳定性最大的三角形作为该节点的高阶三角形。迭代此过程,直到所有满足高阶三角形的节点都有唯一的高阶三角形,高阶三角形中的节点形成初始社团。接着,对于高阶三角形中的每个节点,若该节点满足所属的高阶三角形与邻居节点的高阶三角形之间有多个公共节点且连接紧密,就将两个高阶三角形合并。迭代此过程,直到将所有满足条件的高阶三角形都进行合并为止,初始社团的扩展完成。最后,对于不能构建成高阶三角形的节点,计算该节点在社团中的邻居节点的接近中心度,把该节点加入到邻居节点接近中心度最大的社团,形成最终社团。在真实网络和LFR基准网络上,将LEHT算法与五个经典算法的实验比较分析,结果表明算法LEHT的性能表现更好。针对局部社团检测算法对种子节点选择敏感和对社团扩展的不稳定问题,本文提出了一种基于高阶结构与关系强度的社团检测算法HTRS。该算法首先定义了一种高阶结构motif度,根据每个节点的motif度把节点划分为高阶节点和边缘节点,根据高阶节点的局部邻接密度自适应地确定社团的核心节点。通过核心节点与其连接紧密邻居节点构成的多个高阶结构motif,使用关系强度rs1选择其值最大的高阶结构motif作为初始社团。接着,在高阶扩展阶段,根据高阶节点与社团内节点连接的个数不同,继续细分为两种扩展方式。当社团内两个节点与社团外的一个高阶节点构成高阶结构motif时,通过收益函数将此高阶节点扩展到社团中。对于社团内一个节点与社团外两个高阶节点构成高阶结构motif,通过关系强度rs2将此高阶节点扩展到社团中。迭代此过程,直到将所有的高阶节点加入到社团为止。最后,在低阶扩展阶段,该算法定义了一种关系强度rs3,它同时考虑了边缘节点连接到社团内节点数量与节点的影响力两个因素来确定该节点归属的社团。把边缘节点加入到关系强度rs3值较大的邻居节点所在的社团,形成最终的社团。在真实网络和LFR基准网络上的实验结果表明,HTRS算法能够以高精度和高稳定性地检测社团。综上所述,本文提出的LEHT与HTRS算法都使用了邻居节点间的高阶结构特征,通过局部扩展的方法来检测社团。LEHT算法解决了紧密相邻的节点不能合理划分社团的问题,HTRS算法解决种子节点选取导致社团扩展不稳定的问题。本文的算法检测到了质量高且鲁棒性强的社团。它们对于检测社团结构提供了一个可行的解决方案。