关键词:
中国民歌
地域风格
音乐自动分类
特征提取
特征选择
支持向量机
摘要:
音乐自动分类是音乐信息检索领域中一个重要的研究课题。随着音频数据量的快速增长,如何自动地对其进行管理就成为一个突出的问题。特别对于身边的种类繁多的音乐数据,人们要求有快速高效的方法对它们进行分类管理(根据不同风格或演唱者等),这需要有效的自动分类技术对音频数据进行整理,以便于检索和相关的分析处理。
中国民歌地方色彩丰美,世界各国难与相比,它是中国厚重的历史文化积淀的艺术体现。对中国民歌的地域特点或地域风格的研究,在音乐学、音乐信息检索等方面具有重要的理论和实践意义。本文采用信号处理、机器学习等领域的技术方法,从特征抽取、分类器选择、特征选择三个方面对中国民歌地域风格自动分类方法进行了较深入的研究。
本文建立了两个民歌数据库:原生态民歌数据库和创作型民歌数据库。每个数据库中都包含10个地域的民歌。按照民歌切分片段的长度不同,共形成了四个民歌特征数据集Original10s、Creative10s、Creative30s、Creative60s。本文的实验就是基于这四个数据集的。
音乐自动分类方法一般包含两个阶段:音乐特征提取和分类。本文从每个民歌片段中提取了MFCC、LPC、频谱质心、谱流量、过零率等11个反映音色的特征,最强节拍、最强节拍长度、节拍和等3个反映节奏的特征,能量均方根、低能量帧比例等2个反映响度的特征,共计16个特征74维,形成一个74维特征向量。然后使用音频分类中常用的朴素贝叶斯分类器、Fisher线性判别分类器、K近邻分类器、神经网络分类器、支持向量机分类器在民歌特征数据集上进行分类性能比较实验,实验结果表明SVM在民歌地域风格分类问题上相对于其它分类器性能更好。为了进一步提高民歌地域风格分类的准确率,还使用投票算法对分类器进行组合,并提出一种改进的基于投票算法的分类器组合方法。
为了研究各特征集合及其组合对民歌地域风格分类的影响,本文使用支持向量机的方法,在数据集上对各特征集合的分类性能进行了评估。
特征选择是模式识别中的关键技术,它能够减少分类器的训练时间,提高分类器的分类精度,发现最能反映地域风格的声学特征,本文使用ReliefF、Fisher准则等过滤器特征选择算法,以及序列前向搜索与最近邻分类器相组合的封装器特征选择算法在原生态民歌数据集Original10s上进行民歌声学特征选择,并提出了一种新的基于混合模型的ActiveSelection特征选择算法,实验结果表明ActiveSelection特征选择算法是一种有效的特征选择方法。
音乐分类技术是音频检索以及其他音频处理的重要辅助手段。通过基于内容的音乐分类之后,为进一步的音乐检索和相关的分析处理提供了便利。中国民歌是一种特殊形式的音乐,地域色彩丰美,艺术价值很高,因此,研究基于地域风格的中国民歌自动分类方法是一项非常重要而有意义的工作。