关键词:
私密信息检索
信息论
任意窃听模式
缓存
多消息检索
存储受限
摘要:
随着大数据、云计算的快速发展,数据带来价值的同时,也增加了个人信息泄露的风险。随着个人信息的泄露,用户可能遭受垃圾短信的骚扰,甚至造成严重的经济损失。在用户从服务器获取信息的同时,保护个人隐私是必不可少的一步。私密信息检索是保护用户信息的一种手段,在用户下载的比特中混有一些无用比特,以达到混淆服务器的目的,从而保护用户真正的需求比特的序号。在实现保护用户隐私的同时,私密信息检索技术需要考虑实现方案的效率,即以最少的下载代价获取用户需求的消息。本文研究了三种信息论意义上的私密信息检索模型。针对服务器传输信道被不对称窃听的情况,我们推导出了任意不对称窃听模式下的PIR容量公式,并给出了最优检索方案。最优检索方案将总下载量根据线性规划最优解对服务器进行分配,而逆定理证明则用到了更广泛的Han不等式。相比于对称窃听模型,应用实际中不对称窃听模型更为普遍,因此本研究工作的结论为实际私密信息检索问题提供了设计方案和理论指导。针对有缓存用户要同时检索多个消息的需求,我们提出了充分利用缓存数据的基于MDS码的多消息私密信息检索方法,并推导出了检索容量的上下界。所提方法将无缓存多消息PIR方案中的单比特进行缓存,而所提上界将无缓存多消息PIR与有缓存单消息PIR的逆定理方法进行有机结合。所提上下界在检索消息数大于全部消息数一半、全部消息数为检索消息数的整数倍且缓存容量很小、缓存容量很大这三种情况下吻合,因此在这三种情况下,我们找到了PIR容量。在缓存率为1、服务器数和请求消息数为2时,相比于无缓存多消息PIR和有缓存单消息PIR,有缓存多消息PIR的下载量节省各58.33%/47.61%。针对服务器无编码存储容量有限且用户有边信息的情况,我们设计了基于MDS码的存储受限的私密信息检索方案,并推导出了任意服务器个数、消息数情况下的容量公式。我们的结果表明,服务器在有限的存储率下,对称的存储方式是最优的。相比于数据库内容在多个服务器上复制的PIR模型,服务器存储容量受限的PIR模型更加具有实用性。在消息数和服务器个数都为3、存储率为时,相比于无缓存PIR模型,有缓存的PIR模型可以节约25%的下载量。