关键词:
人机交互
层级结构挖掘
个性化检索
互联网技术
摘要:
随着互联网技术的飞速发展,以用户交互为核心的网站逐渐成为主流的信息交流平台。用户交互行为包括与网络实体信息的交互,例如分享信息、收藏信息、添加标签和心情投票等,以及与用户间的交互,例如建立好友关系等。这些交互行为极大地丰富了互联网内容,但也使得用户面临信息过载的困扰。因此在用户交互网站中(如允许用户交互的新闻网站、Flickr等),充分挖掘用户交互行为提供的新元素,研究基于新元素特征的关键技术,提供有效的检索和浏览策略,帮助用户快速准确地获取所需的实体信息(如群组、新闻、图片等),是信息检索领域面临的新挑战。\n 用户为群组中的图片添加标签的同时丰富了群组的语义信息,挖掘语义信息中的主题结构,将群组按主题逐层细化的层级结构进行组织,有助于用户通过层级浏览的方式,逐步明确查询目的,从而快速准确地定位所需群组:用户为新闻进行心情投票进一步丰富了新闻的情感信息,该信息反映了新闻内容对读者心情的影响,挖掘新闻内容的读者心情特征,研究综合考虑心情、语义等多方面因素的新闻检索方法,有助于满足用户多元化的信息检索需求;用户与好友间的交互信息反映了其相似兴趣,挖掘用户与好友问关联关系能够根据好友的喜好预测用户的喜好,从而满足用户日益个性化的检索需求;综合利用用户的多种交互行为,挖掘利分析用户交互行为所反映出的用户行为特征,特别是发现和预测有影响力的用户,能够帮助用户通过有影响力用户,有选择的浏览高质量信息,从而丰富和提升用户的浏览体验。目前,对网络内容检索和浏览的研究多利用其自身信息或用户的搜索日志,较少从利用用户交互信息、综合多种元素的角度,提供检索和浏览策略。本文以允许用户交互的新闻网站和Flickr为研究背景,以网络数据挖掘技术为手段,针对用户交互的上述特点展开研究,主要研究内容包括:\n 1.提出了一个面向Flickr群组的层级语义结构挖掘、构建方法,用于将群组按主题逐层细化的层级结构进行组织,从而便于用户通过层级浏览的方式逐层明确感兴趣的主题,快速定位所需群组。该方法基于层级主题模型,通过抽取群组集合中具有层级关联关系的潜在主题结构,并将群组映射到己构建的层级主题结构上,形成群组的层级组织结构。在数据集上的实验结果表明,该方法能够有效地组织群组满足用户的浏览需求。\n 2.提出了一种融合读者情感要素的新闻检索方法,刖于满足用户多元化的检索需求。该方法重点研究了依据读者心情的新闻排序算法,并考虑新闻内容与查询词的语义相关性,以及新闻的重要性随时间变化的特性,实现了一种从多角度满足用户需求的新闻检索方法。基于所提方法,我们设计了一个新闻检索系统,验证了该方法的有效性和实用性。\n 3.提出了基于Flickr用户兴趣挖掘的个性化检索模型,通过挖掘用户与好友间的兴趣关联关系,利用好友喜好预测用户喜好,从而满足用户个性化的检索需求。该模型基于图分割方法将用户兴趣用统一的潜在特征空间表示,并利用判别式模型进行特征选择,实现基于好友喜好预测当前检索用户喜好。在数据集上的实验分析表明,该方法能够提高用户对检索结果的满意度。\n 4.提出了一个发现和预测Flickr群组有影响力用户的研究方法,用于识别现阶段以及预测近期阶段,用户认可度高、关注度高的有影响力用户,从而便于用户通过有影响力用户选择性地浏览高质量信息。该方法基于社交网络结构理论,由行为网络构建、网络结构特征挖掘、用户行为模式分析、用户影响力计算和用户影响力预测五个主要步骤组成。在数据集上的实验分析表明,该方法能够有效的对用户影响力走势进行预测。