关键词:
信息检索
本体
查询扩展
Jena
摘要:
近些年来,随着信息技术的快速发展,用户获取信息资源的需求不断增强,众多的信息检索系统被开发出来,方便用户获取其感兴趣的内容。传统的信息检索工具提供给用户的主要是基于关键词匹配的检索接口,但是在很多情况下用户真正的检索意图很难用几个关键词表达清楚,因此导致现有检索系统的精度不高。要提高现有检索系统的精度,就必须将信息检索从目前基于关键词层面提高到基于知识层面、基于语义层面来组织和表示信息,设计合理的智能信息检索系统。\n 本体因为具有良好的概念层次结构和对逻辑推理的支持,已被广泛应用于知识工程、系统建模、信息处理、自然语言理解、数字图书馆、语义Web等领域之中。而把本体融合到传统信息检索技术中去,不仅可以继承传统信息检索的优点,还可以克服基于关键词信息检索不能对概念关系进行处理的局限性。本文即以本体为基础,结合传统信息检索技术构建了一个基于本体的文本信息检索框架OTIRF。\n 首先,本文归纳了传统信息检索存在的问题,分析了基于语义的信息检索的特点以及本体在其中发挥的作用,总结了语义检索领域的国内外研究现状,论证了利用本体技术解决上述问题的可行性。\n 其次,研究了本体的建模元语及层次结构和信息检索领域的相关技术,提出了基于本体的文本信息检索框架OTIRF,介绍了其中的两大关键技术:查询处理和本体推理。\n 然后,阐述了OTIRF的系统构成,研究了框架中主要模块所使用的关键技术。在查询处理部分,提出了两种查询扩展方法,并给出了查询结果排序的计算公式;在本体推理部分介绍了描述逻辑的的概念和推理算法,并研究了基于Tableaux算法的本体推理在框架中的应用。\n 最后,在对课题中关键技术充分研究的基础上,将OTIRF应用在石油测井领域,设计并实现了一个测井数据检索系统WLDRS。