关键词:
进化多目标优化
重叠社团检测
属性信息
节点亲密度
社团融合
社团凝聚力
领导系数
摘要:
随着信息技术的广泛应用,网络中的节点往往携带丰富的信息,同时网络规模也逐渐增大,复杂网络也因此逐渐难以被有效检测。此外,一些节点逐渐倾向于连接并属于多个社团,并在信息流中发挥巨大作用。因此,本文主要针对重叠社团和属性社团的检测进行研究。近年来,越来越多的方法被用于发现复杂网络中的社团结构。然而,这些方法还存在一些问题:现有的方法大多使用拓扑结构和节点属性信息来发现非重叠社团,而属性信息在重叠社团检测中没有得到充分利用,网络中的边缘节点在划分时没有被充分考虑到,网络中的节点连接和邻域信息没有被同时高效利用。本文基于上述问题的思考展开了研究,主要研究内容如下:
(1)提出了一种基于内外连接度融合和节点亲密度修正的进化多目标重叠社团检测方法(FCCNI)。首先,在初始化表示完成后,基于内外连接度判断进行社团融合,将部分内部连接稀疏,而与外部连接紧密的社团相互融合,初步确定社团数量的同时对社团数量进行再次确认和更正。其次,设计了计算节点之间亲密度的函数,并据此亲密度选择节点标签来修正当前错误节点的标签,在初始化和多目标进化过程中多次进行修正。最后,设计的间接由非重叠社团得到重叠社团的方法,在判断各点是否为重叠节点时不仅考虑社团内部连接问题,还加以考虑属性问题,以实现重叠节点的有效搜索。
(2)提出了基于属性预处理和社团凝聚力分析的重叠社团检测方法。首先,该算法利用节点属性信息的特性,提取关键信息并过滤冗杂信息,从而获得更加有效的属性数据。其次,对解码产生的重叠社团通过连边信息计算凝聚力,将凝聚力较小的社团内节点划分到对其吸引力更大的社团中,据此对可能划分错误的边缘节点的标签进行修正。在社团发现完成后,算法还根据属性信息的判断,进行社团融合和标签修正,同时关注发挥更大作用的属性信息,增强划分社团内的属性同质性。该算法不仅关注作用更大的社团属性数据,并且通过不同阶段基于拓扑结构和属性判断的扩展和改进,更加充分利用网络节点不同的特性。
(3)提出了基于领导系数传播和次领导节点修正的重叠社团检测方法。首先,对网络中各节点的自身连接以及邻域信息拓展结合,设计得到节点领导系数,这个领导系数贯穿了整个算法流程。其次,在标签传播后确定重叠社团时,基于归一化的领导系数之差判断过滤掉相对来说可能性不太大的重叠节点,使其成为非重叠节点。最后,考虑网络节点度来增强社团连接,基于社团中的次领导节点及其领导节点来进行社团融合,防止在社团内部链接强度系数比较大的网络中生成一些不必要的过小社团。该算法同时关注了节点度以及邻域信息等不同的网络节点特性,使其对不同类型的网络结构都有效,且基于领导系数传播社团标签信息,提高社团检测准确度。