关键词:
整子多智能体系统
社会化搜索引擎
在线社交网络
搜索优化
知识更新机制
摘要:
Web 2.0时代的到来,在线社交网络应用迅速普及,大量用户涌入在线社交网络平台发表见解、分享生活,产生了大量用户生成内容。这些数据对于提高搜索服务的质量与体验具有重要意义。在此背景下,旨在利用社交网络数据优化搜索结果,提升搜索服务用户满意度的社会化搜索引擎应运而生。然而,已有社会化搜索引擎研究仍然存在4个问题:(1)检索资源大都集中于特定的在线社交网络平台,导致信息检索查全率不高;(2)被动响应用户搜索请求,仅通过用户兴趣、亲密度等知识,研究具体结果排序算法的分析设计,个性化程度并不能令用户满意;(3)忽略了社交网络数据实时变化的特点,无法保证社交网络知识的新鲜度;(4)研究内容局限于算法分析与社会化搜索模式、机理的探讨,缺乏系统模型的设计。因此,针对社会化搜索引擎面临的“检索范围局限、知识应用不足、缺乏社交网络知识的主动更新机制,以及研究碎片化、缺乏模型设计”问题,本文提出了一个面向全网检索资源、支持任务自适应调度、基于整子多智能体的社会化搜索引擎模型,能够利用多种在线社交网络知识优化全网搜索引擎的检索结果,向用户提供个性化的检索结果列表,主动推荐感兴趣的多样化信息。本文的创新性成果主要包含4个方面:(1)提出了一个支持任务自适应调度、面向全网检索资源、基于整子多智能体的社会化搜索引擎模型。本文从任务角度出发,设计了整子多智能体系统符号化模型,在设计Holon结构、建模任务相关信息的基础上,探讨了系统的自适应机制以及任务分配方法。实验结果表明,本文提出的自适应机制能通过对执行单元的竞争力调整以及结构调整,帮助系统适应新的环境需求。该方法尤其适用于解决因部分计算节点失效引起的环境异常,通过调用处于空闲状态或正常状态的执行单元,以协助异常执行单元完成任务,保证任务执行的成功率,提高系统的鲁棒性。(2)设计了一种社交网络数据变化主动感知策略以及社交网络知识主动更新机制。通过分析用户在社交网络平台的行为习惯,设计相应感知规则,主动感知用户社交网络数据变化,考虑到用户行为存在不稳定性,提出的社交网络数据变化感知策略,能够根据用户行为不断学习新的感知规则。在此基础上,为了降低不必要的知识更新引起的系统开销,采用基于阈值的方法判断社交网络数据的变化是否引起知识变化,适时更新相关知识,以保证社交网络知识的新鲜度。实验结果表明,本文提出的方法对于社交网络数据变化的更新率达到了92.6%,社交网络知识的更新率达到了72.5%,能够满足用户的个性化搜索需求。(3)提出了一种基于查询分类的多特征融合结果排序方法。该方法将用户提交的查询词分类处理,针对非导航类查询词,融合用户与网页文档之间的主题相似度,用户兴趣关键词与网页关键词相似度,文档在搜索引擎中返回的位置,成员搜索引擎返回结果的数量等多个特征,为用户提供个性化的检索结果列表。扩展查询词时,在考虑了成员搜索引擎对于文档相关度评分的基础上,融合用户兴趣社团成员的点击记录,以及社团成员在用户兴趣领域的影响力,确定查询伪相关文档,扩展用户提交的查询词,帮助用户更好的表达查询意图。实验结果表明,提出的结果排序方法对于信息类查询词的NDCG均值达到了0.677,对于事务类查询词的NDCG均值带到了0.706,与参照方法相比,具有较高的查准率。(4)提出了一种基于社交网络知识的多样化信息推荐机制。通过为用户提供个性化的结果推荐、热点推荐以及用户推荐服务,建立知识与知识之间的连接,以及知识与人之间的连接。结果推荐方法通过用户的兴趣社团、交互社团、社交社团成员的查询记录,以及社团成员与当前用户的最短路径,为当前用户推荐可能感兴趣的网页文档。热点推荐方法根据用户兴趣的主题分布、用户的兴趣社团成员以及交互社团成员的点击记录向当前用户推荐可能感兴趣的热点。除此之外,提出的信息推荐机制,能够根据用户提交查询的所属领域,帮助用户找到该领域内影响力用户以及非领域用户。实验结果表明,本文提出的结果推荐方法关于信息类查询的MAP值达到了0.743,事务类查询的MAP值达到了0.731;提出的用户推荐方法的相关性分值达到了0.709;提出的热点推荐方法,MAP值达到了0.750。与参照方法相比,本文提出的推荐机制准确率更高,能够主动帮助用户发现所需资源。本文围绕现有社会化搜索引擎存在问题,开展了社会化搜索引擎模型的整体设计及算法、机制、策略等关键技术的研究。所提出的面向全网社会化搜索引擎模型,社交网络知识的主动感知与更新机制,以及基于社交网络知识的结果排序方法与多样化信息推荐机制,能在一定程度上提高社会化搜索引擎的查准率。