关键词:
舆情分析
意见领袖
社团检测
加权TOPSIS
SIR模型
摘要:
随着互联网技术和大数据的发展,越来越多的网民习惯从网络上获取自己所关注的信息资源、分享自己的见解或发表自己的意见,而这些活动的重要载体就是各种类型的网络虚拟社区,如微博。在微博环境中,网络舆论的形成在很大程度上受到意见领袖的影响。当网络中的意见领袖针对媒体所发布的信息、以及后续引起的讨论、最终在用户当中形成成熟的舆论时,对媒体解读与反解读显得更为重要。意见领袖所发挥的作用不仅可以吸引人们对话题的关注,推动网络舆论发展,而且其言论往往能得到社区其他用户的追捧与追随,并且大多数时候在他们在虚拟社区中具有较高的威望。
本文结合社团结构检测和意见领袖识别方法,以微博的“知网正在整改”话题的数据为研究对象,开展舆情事件网络中意见领袖分析研究。
第一部分采用基于节点向量的模糊C均值算法完成微博网络数据的聚类。通过模块度确定网络中每个节点的节点向量,即利用低维向量表示的节点,再在低维向量空间中利用模糊C均值对数据点进行聚类,从而得到网络的社团结构划分。将该算法和其他算法进行实验操作后对比分析,验证本文算法在网络数据聚类方面的精确性和稳定性,更好地挖掘社交网络的社团结构。
第二部分,采用多属性融合的加权TOPSIS法识别网络中的意见领袖。针对目前意见领袖识别过程多以用户属性或网络的结构信息作为指标的问题,以微博为研究对象,采用优序图法加权TOPSIS的相关理论建立意见领袖的识别模型。将用户的属性信息和网络的结构信息相结合作为综合评价指标,采用优序图法计算各指标权重,通过TOPSIS排序方法的用户重要程度评分,并对用户评分排序。针对微博的“知网正在整改”话题的数据,使用意见领袖识别方法进行实验分析,并与单测度指标方法进行对比分析,验证多属性决策意见领袖识别方法的有效性。
第三部分,将基于模糊C均值的社团检测算法和多属性融合的加权TOPSIS意见领袖识别算法相结合,构建基于社团结构的意见领袖识别模型:首先对所构建的舆情网络进行社团结构划分,然后通过使用多属性融合的加权TOPSIS意见领袖识别方法对社团内部进行意见领袖的识别。将上述混合模型应用到“知网正在整改”话题微博舆情网络中。并与结构中心性指标以及多属性融合的加权TOPSIS法所识别的意见领袖进行对比分析,通过SIR传染病模型验证混合模型的有效性。
最后,各项实验结果证明了本文所构建的模型对于意见领袖的判别较为合理。通过首先分析所构建的舆情网络的社团结构,再识别其中的意见领袖,在不改变用户影响力排名的情况下,能够准确、高效地识别微博网络中的意见领袖。