关键词:
废钢识别
深度学习
细粒度图像识别
注意力机制
摘要:
相对于传统的图像分类、识别任务,细粒度图像无论在外形还是其他各个方面都具有较高的相似点。在采集图像过程中,由于目标具有不同的状态、角度、物体遮挡、其他干扰等因素,因此类与类的不同之处较大,同类物体之间的相似度高,在识别的过程中就会导致错误率较高。
(1)论文以废钢细粒度图像为研究对象,从提高图像识别的准确度出发,对采集到的原始废钢图像进行了一系列的预处理操作,几何变换降低了由于设备本身的误差以及滤波去噪、图像增强等技术去除图像中存在的噪声点,以增强废钢细粒度图像的质量,这些预处理操作使得废钢细粒图像自身的固有特点更加明显,以便于后续废钢细粒度图像的特征提取。
(2)通过对预处理后废钢细粒度图像提取了颜色特征、纹理特征以及形状特征,基于以上三种特征提取方法,完成对废钢细粒度图像的特征提取,一共得到40个特征,其中包含有6个颜色特征,27个纹理特征,7个形状特征。最终模型识别的准确率在很大程度上取决于特征的好坏,采用t-SNE降维可视化的方法对提取到的特征进行可视化并为每个样本构造成特征矩阵用于后续建模分析。这些特征将作为后续机器模型的输入,本文的研究是小样本废钢细粒度图像,采用了支持向量机算法对提取到的废钢特征建立模型,取得了较好的识别结果。基于支持向量机算法的准确率可以达到93.4%,精准度为92.7%,召回率为94.3%,F1-score为93.5%。结果表明在废钢细粒度小样本数据集下支持向量机具有较好的识别结果。
(3)将小样本废钢图像数据做数据增强,构建了基于小样本实验的深度学习网络,加入CBAM注意力机制,CBAM模块有通道注意力机制与空间注意力机制,通道注意力机制注重废钢图像的内容,空间注意力机制更注重废钢区域所在的位置。网络的深度、宽度以及图像的分辨率三者的关系进行了约束,实现深度学习在小样本情况下的废钢识别研究。实验结果表明了本文所提出算法的有效性,相对其他方法,本文提出的基于双线性VGG网络在废钢细粒度数据集上达到较高的分类精度,且具有较高的鲁棒性。破碎料识别的准确率达到98%,召回率达到95%,F1-score为96%;轻薄件识别的准确率达到95%,召回率达到98%,F1-score为97%。