关键词:
个性化
元搜索引擎
用户行为
结果排序
摘要:
随着计算机技术的发展,Internet应用需求也日益扩大,各种基于Web的软件技术也得到了长足的进步。为了能够给用户提供及时、准确的信息服务,搜索引擎技术应运而生,搜索引擎作为网络信息服务最基本的手段,在一定程度上可以满足用户对WWW上信息检索的要求,但由于其通用的性质,这些通用的搜索引擎所表现的数据信息覆盖领域广、信息量大、数据不稳定、冗余度大等特性,导致用户查询的精度非常低,其效果难以满足不同背景、不同目的和不同时期的用户查询请求。
元搜索引擎正是满足这种需求的产物,元搜索引擎技术是一种集成搜索引擎技术,它主要通过成员搜索引擎选择、文本选择、结果集成三个主要步骤来完成信息检索任务,如果系统策略设计得当,成员搜索引擎选择方法合适,那么相对于独立的传统搜索引擎来说,元搜索引擎一般可以达到更高的搜索覆盖率和更好的查询效果。但是元搜索引擎也会面临与传统搜索引擎一样的问题,就是不能对用户进行个性化分析和提供相应的有针对性的服务,而且如果系统的集成策略设计地过于简单和机械化,则元搜索引擎多数情况下并不会取得更好的信息检索效果。
本文针对现有元搜索引擎的局限性和当前用户的个性化需求,以用户兴趣模型为基础,提出了实现用户个性化搜索的模型,并研究其相关技术与算法。主要的研究工作包括:①提出元搜索引擎的设计思路,主要介绍元搜索引擎的总体设计模型以及各主要部分的功能,包括查询代理、搜索代理、运算代理三大功能模块。②分析了搜索引擎的查准率不高等性能问题,对个性化技术的本质作了定义和分析,并指出了实现个性化技术的一般步骤和方法。③通过对用户行为特征的统计分析发现,用户的查询关键词和查询过程具有统计意义上的稳定性。因此,建立了以用户行为特征为基础的用户模型。④通过理论分析和性能分析探讨了个性化搜索引擎性能优化的关键技术。结合个性化搜索模型,引入新的信息抽取算法、中文切词算法,以及元搜索引擎采用的几种排序算法。⑤最后,结合用户对搜索引擎的需求发展趋势,指出了今后的主要研究方向。