关键词:
复杂网络
社团检测
非负矩阵分解
半监督学习
图正则
摘要:
社团结构对分析和理解复杂网络的性质和功能具有重要的作用。因此社团检测成为复杂网络分析的一个有效工具,同时也是计算机科学等不同领域广大研究者关注的一个研究热点。然而,由于网络的稀疏性和噪音性,导致网络的社团存在结构模糊、大小不平衡等问题,从而仅依赖于拓扑结构的社团检测不仅不能精确地识别出这样的社团结构,而且不能从语义上理解每个社团的实际意义。针对网络中模糊或不平衡性社团检测问题,本文通过融合少量可用的半监督先验、内容等辅助信息来指导复杂网络的社团检测,研究了一类融合辅助信息的社团检测模型,主要研究内容和创新点可概括为下述三条:1)融合强化网络结构的拓扑相似性信息,本文提出了图正则非负矩阵分解社团检测模型。基于网络的全局和局部拓扑结构,该模型定义了一个新的相似性指标作为辅助信息,并根据图正则的思想将其融入非负矩阵分解模型进行社团检测。生成网络和真实网络上的实验表明,拓扑相似性能强化原始网络中稀疏的拓扑结构,从而有助于提高模糊社团结构(如zout=10的GN网络)的检测精度。2)融合成对约束先验信息并引入节点流行度,本文提出了流行度修正的半监督非负矩阵分解社团检测模型。通过引入流行度来减轻度异质性对一定连接先验信息利用率的影响,本文提出一定连接约束的社团检测模型。进而,考虑到一定不连接先验对社团检测的提升作用,本文通过构建负网络的思想,又提出一定连接和一定不连接同时约束的社团检测模型。这两个模型能够更充分地利用半监督先验信息,尤其对网络中模糊且不平衡的社团,具有更高的检测精度。3)进一步融合节点的内容信息,本文提出了一个融合辅助信息的社团检测及语义信息匹配框架。为了从语义上更好地理解社团的实际意义,针对社团检测和社团语义匹配问题,该框架首先利用半监督先验信息和节点的内容信息分别得到一个精度较高的拓扑驱动的社团结构和一个内容驱动的社团结构,进而引入两者之间的耦合关系矩阵修正社团结构的同时实现社团和内容的准确匹配。本文提出的四个社团检测模型不仅丰富了稀疏网络社团检测的方法体系和研究框架,还为模糊且不平衡等较复杂社团结构的识别提供了理论依据,尤其在恐怖组织、犯罪团伙识别等公共安全领域具有重要的应用价值。