关键词:
语义分析
焦点词提取
语义映射
查询推理
本体
摘要:
随着互联网的迅速普及和互联网模式的创新,越来越多的游客通过互联网查询旅游信息,但是一些旅游景点的信息化程度不高,搜索引擎虽然索引了很多网页,但是其主要基于关键字匹配的搜索模式不能准确了解用户意图,存在搜索结果不匹配,答非所问的情况,这就需要对旅游信息重新整理、组织、规范,形成一个较为完备的知识体系。旅游信息检索涉及到用户理解、语义分析和查询推理。本文以本体理论、语义分析技术为基础,主要研究焦点词识别,语义映射,查询规则,提高用户问句的语义理解程度。运用语义分析技术,对用户的提问进行语义分析,理解用户意图,形成语义理解,通过语义映射找出答案并返回给用户。现有的技术在焦点词提取存在精确度不足,对用户的提问意图不明确,导致无法给出确定回答。本文以桂林旅游信息的语义分析与检索为应用对象,验证了本文方法有效性和实用性。论文的研究工作主要体现在以下几个方面:(1)针对用户问句理解问题,提出了抽取用户问句焦点词的改进算法。该算法在问句疑问词修正方面作了改进,实现了有疑问词情况下识别疑问词作为问句焦点,并能判定问句类型,达到了理解用户意图的目的。(2)提出了一种基于依存关系的问句语义分析算法和根据问句分类的模板查询算法。基于依存关系的问句语义分析算法能够识别出各种句子成分之间的语义关系和限制关系,更好地理解用户意图,根据语义分析算法计算出的结果,到不同分类的问题模板中进行针对性的查询结果,保证结果的正确性和有效性。(3)提出了一种关键词到本体的映射算法,建立从问句分词、句法解析后的关键词到本体知识库的映射关系,为本体知识库的查询推理提供依据。(4)定义了一套查询推理规则,增强系统的推理能力。通常在本体的逻辑表达中只是声明一些公理和通用属性,不能完全包括其他人类常识的推理知识,为了解决这一问题,添加自定义规则,增强系统的表达和推理能力。