关键词:
YOLO算法
目标识别
人工智能
云端部署
可变主题
摘要:
随着目标识别技术的发展,在局域网中部署的模式已经不能满足识别要求。因此,在云计算和网络环境中部署、实现智能识别模型,尤其是YOLO模型是很多应用所需。然而,在实际应用工作中使用预训练好的通用YOLO模型并不能良好地对接应用,需要针对特定的目标类别进行YOLO的模型训练。
本文通过研究YOLO样本数据集的构建、训练模型过程,针对传统标记方法中标记工作量繁重、人工标记精度低且不同一、标记周期长等问题;针对YOLO训练模型识别能力提升的问题;提出了一种基于云计算环境下可以面向可变主题的深度对象识别模型。
(1)对于YOLO的样本训练集,在样本图像数量上包含了几千甚至数万张图片,其中包含的对象类别也数以百计。在公开的数据集中难以找到符合本文要求的数据集,这就需要人工制作样本数据集,在传统的人工标注方法中,常使用的标记工具有labelimg、labelme等标注工具,但是传统的标注方法中存在着对象标记工作量大,标注效果精度低等缺点,本文将SAM模型应用在样本数据集的标注工作中,提出了SAM模型辅助标注方法,这种标注方法能够高速完成大量标注工作的同时,不同标注者的标注内容也较为一致,为获得高质量目标识别模型奠定基础。
(2)在使用样本训练集进行训练得到模型时,因为样本数据集中训练集和验证集的比例不同导致模型的泛化能力不同一,因此使用集成学习的方法,充分利用样本数据集,生成多个模型,通过结合策略的方式,将多个模型进行结合,从而生成一个泛化能力强的理想的训练模型,集成学习的算法可以分为Boosting系列算法、Bagging算法以及随机森林,结合策略有平均法、投票法和学习法。通过研究,集成学习生成的最终模型拥有更强的泛化能力,能够达到预期目标。
(3)YOLO神经网络训练步骤繁琐、过程复杂,为了优化使用YOLO神经网络,本文提出了一种基于Web的目标识别系统,该系统前端使用***建立Web界面与用户交互,通过四大模块对样本收集、训练数据集构建、模型训练和模型测试进行封装,极大程度提高了构建目标识别智能程序的效率。通过实验证明,该系统可以降低使用者的工作量,提高工作效率,降低成本。
(4)无人机巡河需要对目标进行识别,但是巡河过程中的目标识别主题会因各种因素不断发生变化,例如在禁捕期间需要识别违法钓鱼捕鱼的行为、河流中的污染物、河道旁树木发生的火灾、违规建筑、私拉电线等目标。因此,无人机巡河的数据集会随着巡河业务的开展而变化,而本文所提出的识别技术刚好可以应用在此,并通过无人机巡河任务证明本文提出模型的实用性。