关键词:
社团检测
邻接矩阵
标签传播
非负矩阵分解
摘要:
在互联网飞速发展的背景下,复杂网络研究已经成为一项热门研究方向。复杂网络中往往存在属性相似或者关系紧密的结点,社团检测方法通过分析复杂网络中结点之间的联系,将结点划分到不同社团,从而得到社团网络结构。社团检测算法分为两类,即非重叠和重叠社团检测算法。传统的非负矩阵分解(Non-negative Matrix Factorization,NMF)算法将网络的邻接矩阵分解,从而得到非重叠社团结构,但邻接矩阵体现的是每个结点与其直接邻居之间的关系,位于同一社团的结点往往并不只是直接邻居关系。本文在NMF研究的基础上,提出了两种算法,非重叠社团检测算法LPNMF(Label Propagation on Non-negative Matrix Factorization),重叠社团检测算法Link NMF(Non-negative Matrix Factorization on Link-graph)。(1)社团检测算法LPNMF:使用标签传播算法对网络进行社团划分,并得到社团的模块度,在标签传播算法得到的社团结构中,如果两个结点属于同一社团,为其在邻接矩阵中的元素值附加模块度的值,来增强这些结点间的关系。因为标签传播算法有着高效率、不稳定的特性,因此通过多次标签传播,快速得到多个社团,加强每次在同一个社团中的结点之间的关系,然后对新的矩阵进行非负矩阵分解,得到网络的最终社团结构。(2)重叠社团检测算法Link NMF:先将网络转化为边图,获得边图的邻接矩阵,与LPNMF算法的思想类似,通过标签传播算法来增加边图的邻接矩阵中属于同一个社团的元素值,再对由边图的邻接矩阵和标签传播算法获得的新矩阵进行非负矩阵分解,得到边的划分结果,最后将边图还原为原始图。在LPNMF检测到的隶属矩阵上,设置阈值参数来过滤掉多余的重叠结点,获得网络的最终重叠社团结构。在多个数据集上与多个算法进行对比实验,结果证明,本文提出的两个算法在非重叠网络和重叠网络上都能得到高质量的社团划分结果。