关键词:
社团检测
评分推荐算法
属性网络
稀疏性
图卷积
摘要:
随着4G技术的普及和5G技术的飞速发展,线上文字、语音、视频数据呈指数级增长,推荐算法通过分析用户的历史行为为用户兴趣建模,主动推荐能够满足用户兴趣的信息,为互联网用户推送个性化信息。不仅可以降低用户获取需求信息的困难,还可以了解到用户的个人倾向,分析行业趋势,具有十分高的商业价值。设计高效准确地推荐算法成为众多学者的研究热点。
经典的推荐算法如基于协同过滤、基于内容的评分推荐算法通过分析用户的浏览、购买等历史行为获取用户偏好进行评分预测,但是对于历史数据偏少的冷启动用户往往无法准确获取其偏好信息。近年来一些基于社团检测的评分推荐算法被提出,通过直接引入社团检测算法对用户社交网络进行社团划分,使得相似度高的用户划分到一个社团,将同一社团内的其它用户作为服务用户的直接好友,然后根据好友关系定义自身偏好信息进行推荐可以有效缓解冷启动问题。但是用户社交网络具有稀疏性,而且传统的社团检测算法只考虑用户的低阶结构关联,这些因素会导致部分用户在社团检测时被错误划分,给目标用户添加噪声邻居,降低推荐精度。此外,目前基于社团检测的评分推荐算法中邻居之间的信任关系都是二进制的,无法表现用户之间的信任程度。针对用户社交网络具有稀疏性、只考虑用户低阶结构关联、二进制信赖值无法表现用户之间信任程度问题,本文提出一种属性网络社团检测算法(KGCN),并研究基于KGCN社团检测的评分推荐算法。
本文的主要工作包括以下内容:
1.针对用户社交网络稀疏性和只考虑低阶结构关联导致用户被错误划分问题,提出K阶图卷积属性网络社团检测算法(KGCN)。该方法可以有效地缓解原始网络的稀疏性并利用节点的高阶结构进行社团检测。首先根据节点的属性信息对原始网络进行重构,得到重构网络,缓解原始网络结构的稀疏性;其次,针对不同的属性网络考虑到高阶结构关联,采用K阶图卷积编码器对节点进行编码,获得节点的特征表示;最后使用k-means算法进行社团检测得到社团结构。实验对比表明,在Cora、Citeseer、Pubmed和Wiki 4个真实数据集上,相比现有算法KGCN方法取得更好的社团检测结果。
2.针对传统社团检测算法增加噪声邻居和二进制信赖值无法表达用户之间的信任程度问题,提出基于KGCN属性网络社团检测模型的评分推荐算法(KGCN-R)。该方法应用KGCN模型对用户社交网络进行划分,获取用户社团结构计算用户之间的的细粒度信赖值,并重新定义用户的偏好进行评分预测。首先根据用户的历史评级信息定义用户的属性信息,构建用户属性社交网络;接着使用属性网络社团检测算法(KGCN)对用户进行社团划分,得到用户的社团结构;然后使用网络表示学习模型分别对社交抽象网络和每个社团进行嵌入,得到用户的全局特征向量和局部特征向量,计算用户显性信赖值,根据历史评级信息计算用户之间的皮尔逊系数作为隐性信赖值,并融合用户隐性和显性的信赖值作为用户的细粒度信赖值;最后根据细粒度信赖值添加邻居,使用信任传播矩阵分解方法预测评分。实验对比表明,在Filmtrust和Ciao两个真实数据集上,相比现有算法KGCN-R算法可以有效提高推荐精度。