关键词:
语义检索
专利信息检索
本体
语义扩展
推理
摘要:
专利信息是集技术信息、法律信息、经济信息于一体的信息载体,它包含了许多前瞻性的信息,也蕴藏着巨大的战略信息资源,它记载着人类科学技术进步的发展历史,反映了最新科技发展成就。在科研课题立项、技术难题的攻关、新产品的开发、最新发明创造申请专利、国内外先进技术的引进、专利侵权纠纷的处理、了解竞争对手的情况等一系列工作之前,都需要查找专利信息。专利信息浩如烟海,涉及各种领域,要想全面、准确的获得用户所需的专利信息,就要改善现有专利信息检索方式。目前对专利信息的检索多采用基于关键词的检索方式。基于关键词检索的方式,由于采用了串匹配方式,不能从语义层面上检索信息,也不能反映用户检索的真实意图,导致检索结果的查全率和查准率不能满足用户的需求。为了提高专利信息检索的质量,将语义引入到专利信息检索中。
语义检索作为一种新的信息检索技术,它可以在知识理解和知识推理的基础上实现对信息资源的准确、全面的检索。本体作为一种能在语义和知识层次上描述信息的概念模型建模工具,通过本体中的概念、属性定义,概念、属性之间的关系,推理规则和推理过程等方面,刻画了概念之间的语义联系,实现语义智能检索。由于本体具有良好的概念层次结构和对逻辑推理的支持,能够获取概念之间的蕴涵关系,将隐藏的信息表示出来。因此可以对用户的查询请求进行相关性联想,获得查询请求的相关信息,从而提高查询结果的准确度和相关度。
本文深入探讨和研究了本体理论、方法和技术以及它们在实现语义检索中的作用,创建了领域本体;并对语义智能检索模型和所涉及到的关键技术进行了研究。在充分研究应用程序开发包Jena的基础上使用Java语言基于J2EE平台开发出了专利信息检索实验系统。专利信息检索实验系统实现了对于用户给出的检索词,利用本体的概念层次结构和逻辑推理功能,获取与检索词相互等价包含关系、上下位关系以及通过其他关系关联的相关信息,组成关键词的扩展词,提供给用户,帮助用户明确其信息需求,通过为用户提供更多的附加信息进行信息检索,提高专利信息检索的质量和精确性。