关键词:
对等计算
信息检索
资源定位与查询路由
查询结果排序
检索优化
摘要:
对等计算(peer-to-Peer computing,简称 P2P),自 2000 年中期以来迅速成
为计算机研究界和工业界关注的热点。在对等计算系统(简称 P2P 系统)中,每个
节点都拥有对等的功能与责任,即每个节点既可以充当服务器向其他节点提供数
据或服务,又可以作为客户机享用其他节点提的供数据或服务;节点之间的交互
可以是直接对等的;任何节点可以随时自由地加入或离开该系统,形成一个真正
动态的网络环境。这类系统具有许多潜在优势,如系统的可扩展性、鲁棒性、信
息可用性、系统资源利用率高以及能够满足某些特殊应用需求,因而 P2P 被认
为是未来重构基于 Internet 应用的关键技术之一。
虽然当前基于对等计算的研发几乎集中于文件共享应用,但是现有的 P2P 文
件共享系统大都存在仅支持粗粒度(文件水平)、弱语义(甚至缺乏语义)的共
享以及系统的效率低等局限性。为了应对这些挑战,我们提出了基于对等计算的
信息检索,深入研究了这类系统的关键技术所面临的挑战,并取得了以下成果:
(1)提出了三层构架的体系结构,由下至上分别为:结构化层、非结构化
层和应用层。这种新型的体系结构集成了当前流行的结构化和非结构化
两种不同的体系结构,既充分发挥了它们的优点,又消除了它们的不足,
能够更充分地发掘对等计算的潜在优势,因而有效地支持在动态的对等
计算环境中进行信息检索。
(2)在综合评析当前对等计算系统所采用的资源定位和查询路由策略的基
础上,提出了基于节点聚类的资源定位机制和自适应查询路由策略,使
基于对等计算的信息检索系统不但能够高效地利用系统资源,而且能够
有效地满足用户需求。
(3)系统地研究了当前基于对等计算的信息检索系统在检索结果排序和合
并方面所面临的挑战,提出了一种全新的分布式检索结果排序和合并策
略,并解决了与之相关的问题。
(4)进行了检索优化和节点动态分析。提出了一种与对等计算系统特性相
适应的代价分析模型和获得模型中各个代价因子系数的办法;把节点动
态性置于该模型之中,应用模糊集理论来刻画和捕捉节点的行为模式,
进行了节点模糊可靠性分析,以确定节点的可靠性。把检索优化的目标
扩展为:保证检索处理执行时间最短和系统资源消耗最少;同时保证执
行节点在整个检索处理过程中具有最高的可靠性。
(5)基于上述关键技术,研发了基于对等计算的信息检索原型系统:PeerIS。
4
摘 要
总之,本文详细论述了实现基于对等计算的信息检索系统的关键技术和测试
结果。本文的工作是建立在对相关理论和已有技术的详尽分析以及大量的实验测
试结果之上的。实验结果表明,我们提出的基于对等计算的信息检索技术不但能
够支持语义丰富的信息检索与共享,而且能高效地利用系统资源并有效地满足用
户需求。