关键词:
异构本体
P2P
语义
信息检索
Top-k技术
摘要:
随着全球信息化的到来,网络获得了飞速的发展,网络中的信息量也在迅速的增长。截止到2008年7月,世界上最大的搜索引擎的数据库中大约有1,175,311,748篇索引文档。而网上信息量的剧增却导致信息检索效率的日趋下降,出现了严重的“信息过载”和“信息迷航”问题。而对于科研工作者来说,能否更快速更准确地获得本学科领域最具价值的研究动态或是研究成果,已成为影响其科研工作的关键因素之一。为此,我们提出了内蒙古自然科学基金项目——“基于本体的自主式‘科研知识共享’的研究”。作为该项目的一个子系统,本课题——P2P下基于“科研知识本体”的信息检索的Top-k技术的研究与实现,主要在前期已建立的领域本体模型基础上,对基于本体的语义检索技术进行研究、加入了针对异构本体的信息检索,并在分布式环境下实现为检索人员提供最优的k个文档的基本功能。本论文的主要工作如下。
首先,在学习现有的相关技术及已建立的领域本体的基础上,针对该本体模型及课题需求,加入了匹配异构本体的信息检索技术,使它支持领域本体中定义的多种关系的推理功能。提高了查询的查准率。其次,本文提出一种多层次的分布式的查询理念。这一方面减轻了中心索引节点的负担,另一方面又体现了P2P系统分布式的优势,很大程度上提高了检索的速度。最后,研究和比较了现有的信息检索以及Top-k技术。
本文针对本课题的目标,设计开发了P2P下基于本体的Top-k检索系统,并在Eclipse下实现了本系统。该系统的实验数据从结构上以及算法上都体现出了本系统的实用性。