关键词:
社交网络
社团检测
社团安全
社团隐藏
链路扰动
摘要:
现实生活中频繁的信息交互依赖于社交系统的快速发展,这些复杂的社交系统在科学界被抽象化表示为具有特殊含义的社交网络;同时,这些社交网络又为网络科学的兴起和发展提供了原生动力。社团是社交网络的一个重要的结构属性,对网络中的社团结构的挖掘有助于科学家更好的理解社交系统的组成原理和功能,有利于挖掘网络中蕴藏的潜在信息,以及有助于对整个社交系统的发展趋势进行合理的预测。然而,人们频繁地参与社交活动必然会导致泛社交化现象,并且参与社交活动的用户总是在有意识或者无意识的情况下被现代复杂的社交系统所绑架。通常情况下,用户以个人隐私信息作为前提条件来获得参与社交活动的权利,这会给网络用户或与用户有关联的其他人带来隐私泄露的风险。例如,攻击者通过对用户所参与活动的社团进行深度挖掘能够掌握某些用户的生活习惯、家庭背景等隐私信息。基于上述问题,本文首先研究了社交网络中的社团检测问题,并提出一种基于种子用户的局部的自底向上的社团检测方法。其次,本文对社团检测的相关理论进行逆向研究,提出了基于链路扰动的目标社团隐藏算法。本文的主要研究如下:1.提出了一种基于种子用户的局部的自底向上的社团检测方案LBPCD。LBPCD主要研究基于物体的轨迹数据的社团检测方法的相关问题。具体地,本文首先通过研究2018年国际足联世界杯的足球比赛发现在球类比赛中都具有相同的特性,即比赛都是由相互独立的两支队伍对某个目标物体(例如足球、篮球等)进行传递完成的,而这种物体的传递可能发生在同一个队伍之内,也可能发生在不同的队伍之间。因此,每场比赛都会产生许多复杂的目标物体的轨迹数据集,通过对轨迹数据进行预处理,本文构建了目标物体的加权传输社交网络,网络中的链路权重表示目标物体从一个节点到另一个节点的转移传递次数。然后,本文引入了加权社交网络中的网络模块度的概念,在网络模块度的指导下,通过对种子用户进行迭代扩展,从而找出轨迹网络中的社团结构。最后,本文在人工收集的20场足球比赛的轨迹数据中进行了社团检测实验。实验结果表明LBPCD检测算法对于解决类似特定轨迹数据的社团划分问题具有较高的应用价值。2.提出了一种基于链路扰动的目标社团隐藏算法H。为了保护网络中的目标社团免受社区检测算法的攻击,本文提出一种通过对社交网络的链路进行扰动的方法来实现隐藏目标社团的目的。首先,本文对目标社团隐藏问题进行了形式化的描述,并设计了一个评估社团安全性变化的增益函数。基于该增益函数,本文分别证明了在网络中删除旧的链路和增加新的链路对目标社团隐藏所产生的不同影响。然后,在增益函数的指导下,算法H对网络进行有限次数的链路扰动操作,得到一个目标社团被隐藏后的社交网络。最后,本文在不同规模的社交网络中进行了大量的实验,并与其它社团隐藏算法进行比较。实验结果表明,本文所提出的目标社团隐藏算法H相比较于其它的社团欺骗方法而言能够获得更好的隐藏效果。