关键词:
本体
Web 信息检索系统
语义标引
查询扩展
用户兴趣模型
摘要:
为解决Internet 上日益严重的“信息过载”和“信息迷航”问题,智能信息检索和个性化信息服务成为目前信息服务研究的重点。设计合理的智能信息检索系统,基于语义层面表示和组织信息,建立个性化用户兴趣模型,是实现智能信息检索和个性化服务的基础。
本文在回顾这方面的研究现状的基础上,提出一种基于本体和多智能agent的智能Web 信息检索系统,给出它的体系结构、基本功能和工作流程。该系统利用本体技术和智能agent 技术对Internet 上的各类信息进行领域分类,采用本体技术对信息进行语义标引,规范用户信息检索模式,支持个性化信息检索,以达到快速、准确地找到用户所需信息的目的,另外,系统集成了多种智能agent,如任务识别agent、信息收集agent、信息处理agent 等,使得该系统具有了很多新的特点和优点。
给出了一种基于领域本体的语义标引方法,即通过语义分析,建立词汇集合与本体中概念之间的映射关系,然后通过自动词语分析找出文档或文档片断的概念类别及其与其它类别的语义关系,利用这些概念及概念类别进行语义标引。在处理用户查询时,采用概念的同义词表可提高信息检索的查全率,采用上下文语义去除相关度不大的歧义概念,在一定程度上保证信息检索的查准率。通过采用本体标注用户提问和自动收集用户查询历史纪录,构建用户兴趣模型,从而有效提高搜索的准确性,实现用户的个性化查询。