关键词:
汉服检测
YOLOv5s模型
Repvgg模块
注意力机制
SIoU_Loss函数
摘要:
华夏服饰之美源远流长,汉服作为重要文化载体备受关注。然而,现代汉服风格辨识的难题阻碍了其传承与发展。本文利用目标检测领域的杰出网络——YOLOv5s,旨在通过构建多风格汉服数据集和优化网络结构,以精确捕捉汉服风格特征,为推广与传承汉服文化提供新思路。本文具体研究内容如下:
(1)对现代汉服风格图像数据集构建方面进行研究。本文以现代汉服对应朝代特征为分类标准,构建了现代汉服风格图像数据集,以应对现代汉服款式多样和风格差异的挑战。本文创新性地采用了主客观结合的方式对数据集进行划分标注,一方面使用既往文献对汉服的朝代风格描述进行判断,另一方面积极采纳了10位汉服专家及5位汉服爱好者的经验判断,确保了数据集标注的准确性。具体将其划分为“秦汉风格”、“魏晋风格”、“唐朝风格”、“宋朝风格”和“明朝风格”五类。同时,通过手工标注和数据增强等方法对数据集进行了预处理和扩充操作,实现对现代汉服风格图像数据集的构建。
(2)基于目标检测网络YOLOv5s模型优化进行研究。由于目前服装图像检测领域长期存在检测精度难以和检测速度保持平衡的问题,本文对YOLOv5s模型进行了一系列模型优化操作,力争在保证检测精确率高的同时可以达到实时监测的效果。本文以目标检测领域中性能卓越的YOLOv5s作为基准模型,分别在主干特征提取网络插入Repvgg模块,颈部特征融合网络引入SE注意力机制以帮助模型更精确的提取到现代汉服的相关特征,从而提高风格分类的精确度。此外,本文在检测端口处采用更适合现代汉服的SIoU_Loss函数,提升了预测框的匹配和定位精准度。这些优化措施旨在实现现代汉服风格检测的精度和效率之间的平衡。
(3)验证改进后模型的优越性和实用价值。本文将所构建的现代汉服风格数据集应用于主流目标检测模型与优化后的模型进行对比评估,并进行相关优化策略的消融实验进行验证。实验结果表明,本文所提出的方法在多项主流评价指标上均取得明显提升,整体准确率达到92.4%,召回率达到91.6%,平均精度均值达到91.8%,并且可以达到实时检测的效果。该方法有助于更快速更准确地辨识汉服风格,促进大众对现代汉服风格特征的了解,同时为传承发展中华优秀传统文化提供技术支持。