关键词:
在线批阅
文本检测
版面分析
YOLOv7
DeepLabV3+
摘要:
无结构标记试卷作为课堂测验或者期末考试中采用的答题方式,在结构设计上具有灵活性。由于此类试卷缺少对答题区域的限制,为版面分析带来了挑战。以往的版面分析方法在布局规则的版面中实现区域的划分,而无结构标记试卷中含有大量的手写文本,部分作答内容超出答题区域,导致不同题目的答题区域难以分开,影响了版面分析的准确率。
本文针对此类试卷的印刷体文本检测与版面分析的问题,首先进行试卷中印刷体文本区域的检测,再通过语义分割模型和试题区域分割算法完成版面分析。同时,构建无结构标记试卷阅卷系统,使阅卷者通过该系统完成试卷的在线批阅。
为了提高印刷体文本检测的准确率,在YOLOv7模型的骨干网络部分加入Swin Transformer V2模块,利用其特有的移动窗口化机制,增强网络的全局特征提取能力;针对YOLOv7骨干网络中ELAN模块计算复杂和参数量大的问题,采用Ghost Net V2模块替换ELAN模块,减少模型的参数并提升模型性能;针对原始损失函数缺少类别信息的权重因子问题,将模型的损失函数替换为SIo U,进一步提高模型的训练和推理速度。实验表明,同现有模型相比,改进后的模型在参数量缩减至45.6m的情况下,检测精度达到了90.8%。
为解决答题区域布局不规则,影响试卷版面分析准确率的问题,本文提出了基于Deep Lab V3+的改进模型和试题区域分割算法。构造了融合投影特征图的多通道输入模型,使模型更关注试卷的布局结构,再结合构建的C_ASPP模块,提升网络的特征提取能力,从而提高试题区域分割的准确性。通过试题区域分割算法,将掩模图像进行水平投影,并判断印刷体文本坐标与图中波谷坐标的位置关系完成区域的修正,实现对试卷的版面分析。改进后的模型相较于原模型,平均交并比提高了2.5%,准确率提高了3.5%。
结合上述研究,本文构建了集成模型,设计并开发了阅卷系统,为无结构标记试卷的在线批阅提供了一种可行的解决方案。