关键词:
考古数据分析
数据泛化
遗址发掘信息管理系统
良渚遗址
摘要:
随着考古工作的深入开展,越来越多的数字考古资料产生出来,对文物保护和考古研究工作有着非常重要的价值。随着考古数据越来愈多,在查阅、分析这些数据时,多余重复的那些信息给相关人员会带来不必要的麻烦。数据泛化技术作为数据挖掘技术的重要一环,可以简化此类考古数据,方便管理,进而深入分析考古资料背后隐藏的规律和知识,有效地提高考古研究的效率。本文针对此类需求,以实际考古工作为例,研究数据泛化技术在考古数据分析领域的应用。本文深入分析了经典的面向属性归纳的数据泛化算法,并以相关数据为例阐述其在考古数据分析领域的应用。针对经典算法的阈值需要手动具体设置的情况,提出了自顶向下的用户交互方法对其进行改进,然后在良渚遗址数据集上进行相关实验,结果表明算法能改善数据分析效率。针对结果集存在无效规则的情况,设计了基于支持度的规则过滤方案,并用示例进行了说明,同时本文还分析了经典算法和改进算法的时间复杂度和空间复杂度。另一方面,本文还讨论了基于聚类算法对考古数据做泛化处理的机制。在良渚遗址数据集上使用自底向上的层次聚类算法对数据处理,得到的泛化结果比起原始数据更为简洁,符合预期目标。但是比起属性归纳算法,聚类算法时间复杂度过高,章节末尾还对两个算法的优劣进行探讨。泛化结果的可视化过程也是本文的研究工作之一,将结果以折线图、饼图方式展现比表格更为直观。最后,本文介绍了遗址数据采集与管理系统,系统集成了对复杂多样的考古数据的采集、集成、查询、更新和分析功能,并在分析功能中实现了遗址数据泛化模块。泛化模块设计了用户条件输入框、结果展示界面和可视化界面,方便考古研究人员快速分析考古数据。