关键词:
深度学习
社区预测
深度自编码
动态网络
聚类
摘要:
随着互联网的不断发展,人们之间的联系更加紧密,导致个体意识的弱化,团队能力的增强,逐渐形成以不同属性为的社区为基础组成庞大的社交网络。社交网络中往往表现为社区内部关系非常的密切,而社区与社区之间的关系非常的稀疏。社区检测是逆化社区形成的过程,从复杂的社交网络中识别出内部联系紧密的社区结构。然而,现实社会中社交网络的结构不是固定不变的,它是随着时间而不断的改变。基于动态网络的社区检测,以及预测社区的演化预测,在研究社交网络结构上具有重要的意义。传统社区检测方法中,大部分涉及到网络的静态快照,没有反映出社区在多个快照上的动态变化。本文的研究主要内容是将社区中的动态变化纳入分析可以预测网络演变的趋势,将动态网络中节点的拓扑结构、文本信息等等相结合,基于表征学习来提高社区检测的效果,以及增加时间分析增强社区演化预测的效果。首先,我们研究了在动态网络中的社区检测问题,并提出了一种新的基于图卷积网络的多元表征学习算法DGAE(Dynamic graph Auto-encoder)。在连续时间序列中,将动态网络中多个时间戳下的用户关系以及文本内容嵌入到时间共享矩阵(Temporal Shared feature matrix)中,并通过使用图卷积网络来学习通过文本信息相关联的用户之间的潜在表征。结合用户的多种信息,来提高社区检测的准确度,最后通过聚类来获得所需时间戳动态网络的社区网络结构。其次,我们研究动态网络中的社区预测问题,提出了一种加入时间分析的深度自编码网络TDAE(Temple deep Auto-encoder)。将动态网络中的多个时间戳下共享矩阵重新嵌入到时间共享矩阵(Temporal Shared feature matrix)中。通过重构的深度自编码学习,从而获得含有社区演化信息的潜在表征,获得的潜在表征中学习了网络的特征以及连续变化网络的时间演化特征,则解码后的网络可以作为社区演化的预测,最后通过聚类最终获得对未来社区结构的预测结果。本文通过两个Synthetic dataset和一个ar Xiv dataset作为数据集来验证算法效果,通过Jaccard相似系数和Purity纯度系数两个指标对DGAE和TDAE算法评估。实验表明,本文提出的DGAE算法与社区检测基准算法相比较,DGAE算法具有较高的准确性和较少的时间消耗。本文提出的TDAE算法与社区检测基准算法比较,TDAE算法具有有效的社区演化预测,与社区预测基准算法比较,具有较好的准确性。