关键词:
个性化信息检索
用户偏好
鼠标滑动
满意度
意图边界检测
社交网络
摘要:
个性化信息检索旨在根据用户不同的信息需求,结合主观价值倾向,给具有不同信息需求的用户返回符合其期望的检索结果。其核心内容在于分析不同用户的个性化特征,结合其自身价值倾向差异,建立个性化检索模型,从而更好的提升用户的检索体验。本文针对个性化信息检索中用户偏好分析任务开展了深入研究,文章的主要内容归纳为以下三个方面:基于“滑鼠行为”量化的检索满意度研究从用户信息检索行为特征入手,提出一种基于“滑鼠行为”能量消耗的满意度评价及量化模型。其中,“滑鼠行为”指用户在网页中的鼠标滑动轨迹以及点击等行为序列。首先,从用户端对信息检索质量评价的主观因素出发,引入“检索满意度”作为衡量信息检索质量的新特征;其次,通过计算用户“滑鼠”过程中的“能量消耗”,分析检索行为特征与用户满意度之间的关联性;最后,基于量化数据建立滑鼠的“能量消耗”对比模型,用于表征用户检索满意度的强弱。这一研究重点关注用户检索满意度的量化分析方法,为信息检索系统质量评价提供了一种新的特征。基于边界检测的查询意图切分技术研究通过分析用户连续查询日志,提出一种查询意图边界识别方法。用户完整查询意图中包含大量的检索习惯及个性化特征,识别查询意图发生改变或转移的临界位置,能够为从完整意图分析层面提取用户的个性化检索偏好提供有效的方法。首先,从大规模样本集中抽取并人工标注部分完整意图片段;其次,结合文本特征抽取方法构建自动化学习模型,包括分类及序列标注的方法,分别使用SVM和CRF模型;最后,通过开发及测试数据集优化学习算法,获得最优的意图切分性能。这一研究借助用户查询日志,通过自动化的意图片段切分技术,为抽取用户的个性化偏好特征提供研究基础和技术手段。用户社交媒体活动与信息检索关联性分析研究通过获取用户在一段时间内的网络活动内容,分析用户在不同时间段内进行信息检索与社交网络活动之间的关联性,建立基于个人文化背景及兴趣倾向的个性化检索模型,改善检索体验。首先,设计实验平台抓取用户在一段时间内的网络活动信息;其次,抽取其中社交网络内容及信息检索相关内容;最后,构建关联性分析模型,度量社交活动与检索行为之间的关联关系,以便利用社交网络信息构建个性化检索模型。这一工作侧重研究用户的文化背景及价值倾向对信息检索行为的影响,以便为利用社交网络信息构建个性化检索模型提供理论依据及研究基础。综上所述,本文针对个性化信息检索中用户偏好分析的任务,从三个方面开展相关工作,旨在为个性化信息检索中的用户偏好分析提供更加新颖、有效的研究思路及技术方法。