关键词:
模式结构
表示信息
局部信息
聚类
矩阵化特征表示
摘要:
基于矩阵化特征表示的分类器可以克服时间复杂度高、维数灾难等问题,可以直接处理图像等矩阵模式,并且具有较好的分类正确率。而现有矩阵化Ho-Kashyap修正算法因为忽略了模式之间的结构信息,而且仅采用一种矩阵表示,所以它无法处理实际应用问题。为此,本文研究基于矩阵化特征表示和Ho-Kashyap算法的分类器设计方法,从而克服矩阵化Ho-Kashyap修正算法的不足并提出更有效的分类器设计方法。本文工作的主要贡献如下:
(1)现有矩阵化Ho-Kashyap修正算法仅考虑模式个体和类别结构,忽略了模式之间的结构信息。如果用聚类方法将一个类分成多个子类,子类内模式具有较高相似度,但子类间模式具有较低相似度,那么,这些子类就可以反映模式之间的相似度和结构信息。这种结构被命名为子类结构。本文利用子类结构,提出一种三层结构的Ho-Kashyap修正算法。
(2)常规矩阵化Ho-Kashyap修正算法仅采用一种矩阵表示,不能显著提高分类器的性能。另一方面,同时使用模式的多种矩阵表示的传统的分类器无法确定每种矩阵表示在表示空间和每个模式在不同模式空间的权重和影响。因此,本文利用模式双重局部信息予以解决。首先,一个模式有多个具有不同表示信息和判别作用的矩阵表示。如果把这些矩阵表示组成一个表示空间,那么,它们的表示信息和判别作用被视为模式的第一重局部信息。一个多矩阵分类器是由多个矩阵表示融合而成,基于一个矩阵表示所生成的分类器可以作为其中的子分类器,生成子分类器的过程被视为矩阵表示学习过程。在一个矩阵表示学习中,不同模式对于一个子分类器的作用不同,不仅如此,同一个模式在不同矩阵表示学习中的作用也不同。所以,模式在一个矩阵表示学习中的作用被称为第二重局部信息。本文利用双重局部信息,提出一种双重局部化多矩阵学习机。
(3)三层结构的Ho-Kashyap修正算法缺少对模式双重局部信息的利用,双重局部化多矩阵学习机仅从全局角度来考虑模式的双重局部信息,没有使用子类结构。为此,本文把它们结合起来,提出一种具有五方面模式信息的多矩阵分类器。这五方面模式信息包含模式的类别,个体和子类结构的信息、矩阵表示的表示信息和判别作用以及模式在一个矩阵表示学习中的作用。这种分类器既有三层结构又利用双重局部信息,从而把更多的模式信息应用到分类器设计中。
(4)结构风险最小化是一个广泛用于评价分类器有效性的准则。但是,三层结构的Ho-Kashyap修正算法仅考虑了全局结构风险最小化。再者,绝大多数分类器设计方法或仅考虑全局结构风险最小化,或仅考虑局部结构风险最小化。为此,本文提出了一种新的分类器设计方法,即全局和局部结构风险最小化,以有效地改善分类器的性能。
(5)三层结构的Ho-Kashyap修正算法、具有五方面模式信息的多矩阵分类器以及全局和局部结构风险最小化的性能依赖于聚类方法的有效性,所以,子类结构的合理利用和生成合适的子类对于有效地提高分类器的性能至关重要。因此,本文提出一种多因素核聚类修正算法,以更好地进行聚类并提高分类器的性能。这种聚类算法不但可以用于向量模式,还能用于矩阵模式。它比传统的k均值和层次聚类方法有更好的性能。
本文以机器学习数据库、手写数字、人脸图像、视频等数据集为应用背景,研究基于矩阵化特征表示和Ho-Kashyap算法的分类器设计方法。本文工作表明,以Ho-Kashyap算法为基础并利用更多的矩阵化特征表示,可以有效地提高分类器的学习和推广性能,并且可以处理大量实际应用问题。