关键词:
多任务学习
多视图学习
持续学习
深度学习
辅助任务引导
摘要:
随着大数据和人工智能技术的蓬勃发展,各式各样的数据不断涌现,人们往往试图从各种复杂数据中挖掘有价值的信息和知识,从而帮助相关任务的学习。然而,每个任务所能获取或挖掘的知识往往是有限的,信息不充分对于部分学习任务的性能提升造成了一定阻碍。多任务学习作为人工智能领域的前沿研究分支之一,是一种模仿人类智能的研究方法,旨在结合不同的相关任务共同学习,从其他任务中捕获有效信息弥补当前任务中的不足知识,使得所设计的算法或模型能够触类旁通,最终提升每个任务或主任务的学习性能。如何运用多任务学习在不同场景中提升学习性能已然成为人工智能领域的重要研究方向。本文以多任务学习为核心研究课题,结合多视图学习、持续学习、城市时空挖掘和信号时序挖掘等技术,拓展多任务学习技术的应用场景,设计新型多任务学习方法/模型,并在相关任务背景下验证多任务学习技术的有效性。主要的研究工作和贡献总结如下:(1)基于多视图学习的多任务表示学习随着数据挖掘技术的发展,衍生出一种同时包含多任务和多视图属性的新型学习场景,称为多任务多视图学习。现有的多任务多视图学习通常适用于分类,并认为所有任务共享相同的类标签集。然而,在现实世界的应用中,关于标签集的信息并不多,而且大多数学习任务很难包含同构标签集。因此,为了克服这两个限制,本文提出了基于多视图学习的多任务表示学习方法,以无监督聚类分析为研究任务,设计了一种基于局部线性嵌入(LLE)和拉普拉斯特征图(LE)方法的多任务多视图聚类算法,将多视图数据映射到公共视图空间,在引入多任务学习挖掘共享知识表示与任务特有特征,最后利用K-Means方法实现数据划分。在七个多任务多视图数据集上的实验结果表明,所提出的L3E-M2VC算法优于基准算法,验证了所提方法的有效性。(2)基于持续学习的多任务表示学习目前大多数多任务学习方法都是为固定任务集量身定制的,不适用于持续/序列输入的场景。本文提出了基于持续学习的多任务表示学习方法,设计了一种基于知识转移的深度矩阵分解持续聚类算法,以解决持续场景下的多任务聚类问题。该方法能够有效处理序列任务,通过所构建的知识库对历史任务的知识进行存储,并在未来任务中进行知识重用,实现跨任务知识迁移。此外,提出了一种新颖的优化算法使得变量更新过程中不再访问历史任务的原始数据,从而减少内存消耗和时间开销。同时,本文还将所提出的算法扩展到半监督版本,利用先验标签信息实现持续半监督聚类。在四个数据集上的实验结果表明,所提出的方法明显优于最新的基线方法。(3)面向多城市的多任务深度时空挖掘城市交通流量预测目前已然成为城市计算中的一个热门研究课题,然而现有工作大多适用于单个城市,无法较好地泛化到其他城市。实际上,不同城市之间通常具有一些相似的时间规则或通勤规律。因此,一个城市的数据及其知识可用于帮助改进其他城市的时空挖掘性能。为解决上述问题,本文提出了面向多城市的多任务深度时空挖掘方法,利用多任务学习技术多个城市之间的空间依赖性和时间规律性特征,研究了一种面向多任务场景的多城市交通流量预测方法,旨在为多个城市建立一个通用的深度学习模型,以处理多个城市的交通流量预测任务,协同提高各个城市交通流量预测的性能。在两个城市数据集上的实验结果证实了所提模型的有效性。(4)辅助任务引导的深度时序挖掘当前的多任务学习往往考虑不同任务具有相同的重要性或优先级,模型旨在同时提升每个任务的学习性能。然而,真实场景中部分任务通常只是用于辅助主任务的学习。因此,本文关注辅助任务场景,提出了辅助任务引导的信号时序分类方法,设计了一种辅助正交引导损失的信号时序分类模型。通过分析信号时序的特有性,即:1)信号时序是一种长序列和模式稀疏数据;2)信号时序包含多粒度信息,本文提出了一种用于信号时间序列分类的辅助正交引导损失Transformer,以特征学习为辅助任务,设计了一种新颖的辅助正交引导损失,以增强全局特征和局部特征之间的多样性,帮助后续分类主任务。在四个数据集上的实验结果和可视化分析表明了所提方法的优越性。