关键词:
鸟类识别
信号分析与处理
数据增强
深度学习
摘要:
鸟类的观察与监测是生物多样性保护行动中的重要环节。基于鸣声进行鸟类的观测识别,由于其干扰性低、监测范围广、采集高效等优势,更是具有广泛的应用前景。本文针对实际环境下的鸟类鸣声识别进行了研究,主要的工作内容如下:(1)鸣声信号预处理及特征提取研究,将基本谱减法降噪进行自适应化,辅以自适应双门限法提取音节,以适应复杂的采集环境,并采用基于自适应最优核时频分析的方法,进行特征提取,将得到的包含能量信息的时频特征图作为识别模型的输入。(2)分析当前常用的音频信号分类模型的优缺点,在此基础上,基于Dense Net网络,进行了分类识别模型设计,针对其学习率以及结构深度,优化设计了不同的微型网络。选取我国居民区及农田中常见的30种鸟类构成样本库进行实验,在该样本数据库下,较优模型达到95.01%的识别准确度。(3)采用基于音频以及图像的联合数据增强策略。音频数据增强,进行了叠加和调音处理;图像数据增强,基于生成对抗式网络,采用DCGAN网络结构,设计了不同结构的生成器,通过实验对其生成图像质量进行了分析,并选取生成图像质量较好的结构作为生成器模型,对特征图进行数据扩充。在经过数据增强后的样本库上,较优分类模型的识别准确率达到96.7%。(4)建立基于移动终端的鸟类识别系统,以Jetson Xavier NX板卡作为移动终端,采用Python的Qt库进行图形交互界面的制作,结合深度学习模型,经测试,可以有效进行本地和实时的鸟类鸣声的分类识别。从实验结果来看,本方法能够适应不同的采集环境,缓解实际情况下鸟类鸣声交错叠加、远近不同,以及鸣声样本相对较少这几类问题对识别模型及结果的影响,且复杂度较低,具有较好的实时性,对鸟类监测识别工作存在着启发及意义。