关键词:
语义
信息检索
关联推荐
本体
摘要:
随着互联网技术不断向前发展,信息量的增长速度已经到了叹为观止的地步。这样的发展速度导致用户从茫茫信息海洋之中寻找自己需要的信息已经变得十分的困难。搜索引擎的提出与推广从很大程度上解决的用户难于检索信息的麻烦。用户通过向搜索引擎提供搜索关键词,即能方便的找到自己需要的信息。然而传统搜索引擎在不断发展过程中遇到了很大的困难。首先,基于简单关键词匹配的传统搜索引擎检索方法使得搜索引擎无法准确的理解用户的所要表达的语义层面的意义,加大了用户查询信息的难度。其次,搜索引擎通常返回大量的搜索结果,而用户通常只会浏览前面几页或者十几页的结果,导致虽然搜索引擎返回了用户需要的结果,但由于排名靠后,其结果无法被用户看到。最后,虽然推荐系统现已大量运用于电商、在线音乐等等领域,但推荐算法任然存在比如数据稀疏导致推荐准确率下降等等问题。基于以上问题,作者对语义检索及推荐系统进行研究,并在现有成果基础上,提出了一些新方法。本论文主要工作包括:基于软件工程思想提出了一种新的本体库构建方法:螺旋本体法。该方法在本体构建过程中加入风险评估过程,并提出本体构建需要通过不断迭代来保证本体构建的正确性并能够有效的降低开发过程中将会面临的风险。在分析章节作者将螺旋本体法与其他常见的本体构建方法进行对比,指出该方法的优点,并通过protégé本体构建工具使用螺旋本体法构建本体库。提出一种适用于本体的索引结构并对Lucene的评分算法进行改进。首先通过对Lucene现有索引代码及结构的分析,提出一种适用于本体的Lucene索引结构。其次在分析了Lucene现有评分算法的基础上,提出一种综合考虑了查询关键词词频、用户点击量统计、基于经验三个方面的自动标记关键词权重的方法,并在此基础上对检索结果的本体进行评分,最后依据评分进行排序。通过实验证明,使用该索引结构与更新的评分算法能够提高检索结果。提出基于本体库的协同过滤推荐算法。分析已有协同过滤推荐算法,特别关注用户数据矩阵稀疏的问题,基于已有的本体理论,提出了新的协同过滤推荐算法。并通过实验证明使用基于本体库的协同过滤推荐算法能够提高推荐结果的准确率。