关键词:
音乐生成
五声调式
相似度
Transformer
Markov
摘要:
在音乐生成领域中,深度神经网络与机器学习等技术被广泛应用,发挥着至关重要的作用。深度神经网络具有强大的学习和分析能力,通过对旋律、和弦、节奏等核心音乐元素进行精准分析,使模型可以创作出风格迥异、充满创意的音乐作品,但主流的音乐生成模型更多的应用在西方音乐中,对于中国民歌旋律生成的研究涉及较少,关于中国民歌旋律数据集的构建及生成模型较为稀缺,所以建立中国民歌旋律数据集、设计可以学习中国民歌旋律的特点的模型具有一定的意义。根据中国民歌旋律的结构特点与音符分布,本文深入展开研究,并提出了一种结合Transformer和Markov链的生成模型。这一模型旨在实现生成旋律的结构与风格和谐统一,为中国民歌的传承与创新提供了有力的技术支持。该模型以自建立的中国民歌旋律数据集为基础,结合相似度计算与深度学习中的深度神经网络,致力于生成即符合音乐结构又带有的中国五声调式特性的音乐。本文主要内容如下:
(1)数据采集及分析处理。本文借助爬虫技术,从网络上抓取大量MIDI格式的中国民歌旋律数据和XML格式的中国民歌乐谱,接着对数据进行清洗、整理和格式预处理,从而建立MIDI格式的中国民歌旋律数据集,接着对数据集中的音符分布和基础特征进行分析,并验证了数据集的民族性。而后引入文本相似度计算的方法对音乐数据集中的主题小节进行标记,通过对余弦相似度、Jensen-Shannon散度、Jaccard相似系数算法进行对比分析,选择合适的相似度算法对主题小节进行标记,为后续的旋律生成研究提供有力的数据支持。
(2)基于Transformer中国民歌旋律生成模型构建。在Theme transformer框架的基础上,添加一个新的编码器作为非主题区域音符信息的捕捉,从而把握不同区域的位置信息。生成阶段中,结合马尔科夫链和三音符结构捕捉到中国五声调式中的风格信息,通过音符的状态概率转移矩阵生成具有五声调式的音符序列,输入到非主题区域解码器中,使模型能够生成具有重复主题结构并具有五声调式风格的音乐,最后通过实验对比Theme transformer和Folk transformer模型进行量化评估,通过客观评价指标以及主观评价验证其有效性,实验结果证明Folk transformer生成的音乐中,中国民歌五声调式音符明显增多。
(3)搭建中国民歌旋律生成系统。基于Folk transformer模型设计了中国民歌旋律生成系统。该系统基于Django框架进行搭建,为用户提供了直观的web端访问界面,实现了包括账号注册、登录与管理在内的完善用户管理体系。还包括上传MIDI音乐文件、音乐生成、在线播放与下载等功能,用于辅助音乐爱好者完成音乐创作。
本文模型已被证明能够产生旋律较为优美、和谐连贯、具有鲜明中国民歌五声调式特征的中国民歌旋律,也符合一定的音乐语法特征。同时,本文模型也可以用于其他需要考虑结构逻辑和风格的艺术创作。