关键词:
涉密检查系统
终端信息检索技术
多模式匹配NKMP算法
模式匹配
文件解析技术
摘要:
当今世界,网络迅速发展,它在给我们带来丰富资源和便捷服务的同时,也带来了一系列风险。数据丢失、信息窃取现象数不胜数,成为人们网络生活的重大隐患,甚至带来经济损失。尤其是军队、政府这样的部门,其信息机密性强,一旦泄露或丢失将给国家和单位造成巨大的损失。
针对这一问题,本文设计实现了涉密检查系统,它作为检测企、事业单位局域网内部计算机终端涉密数据及系统运行的重要工具,极大地增强了数据保护力度。终端信息检索是涉密检查系统的主要功能,本文对局域网内终端信息检索技术进行了研究。这种基于终端的信息检索技术与以往的web检索技术不同,它面向计算机存储内容的检查,帮助用户了解个人计算机存储的数据内容。终端信息检索技术通过模式匹配的方式精确查找信息,看重检索结果的准确性。
模式匹配算法则是终端信息检索功能的核心算法,本文分析了几种经典的模式匹配算法,在此基础上提出了一种新的多模式匹配算法--NKMP算法,它借鉴了KMP算法跳跃思想,同时匹配多个模式字符串。该算法通过模式字符串集构建多维skip数组,并由skip数组决定下一次匹配的字符位置,同时利用模式字符集CSet跳过多余字符,最大限度地避免不必要的匹配,提高检索速度。以此为基础,设计并实现了应用XML数据库的终端信息检索功能,它利用NKMP算法进行检索,并记录、更新每次检索结果,为下次检索提供先验信息,降低搜索代价,维护了内网数据安全。
最后,本文对系统和算法进行了测试,测试结果表明:涉密检查系统不但能够实现功能,安全有效地保护计算机数据安全,而且性能良好,对于同样文本数据量,涉密检查系统的检索速度要优于其他同类产品。