关键词:
子空间分析
子空间聚类
簇间相关性
低秩表示
难分类病变
摘要:
过去的几十年里,多种模态的数据爆炸式增长。虽然这些数据形式上多为高维,但它们的内在维度通常比形式上的维度小得多,目前被广泛研究的子空间分析可以用于这种高维数据内在维度的分析和处理。子空间分析中,由噪声引起的簇间相关性会影响数据的内在结构分析,导致子空间算法性能降低。针对该问题,本论文从不同子空间之间的相关性入手,改进低秩表示模型的子空间分析算法。同时由于目前的乳腺病变分类算法大都是基于单级分类算法,因此本文提出了两级分类算法并将子空间方法应用医学影像数据的分析中。本文工作主要分为以下两部分。(1)提出了检测簇间相关性的方法,并在此基础上进行聚类分析,以降低光照等噪声对子空间分析的影响。本文基于低秩表示得到的表示矩阵来检测具有强簇间相关性的异常数据,并通过构造新字典,建立低秩模型,从而对数据进行子空间聚类。另外,本文还对纹理数据进行了预处理,该方式使子空间聚类也能够被有效地扩展到纹理数据分析中。实验表明,算法在纹理数据上的聚类准确率能够达到90%,在Extended Yale Database B上的聚类准确率达到93%,在AR数据集的两个实验中,聚类准确率分别达到95%和83%。同时,为了证明所提方法可以减少簇间相关性,本论文在不同数据集上计算了相关性参数,最后发现所提方法的相关性参数最小。(2)乳腺DCE-MRI肿瘤良恶性的分类中,基于病变形态特征、动态增强特征和纹理特征,提出了通过区分常见病变和难分类病变来提升总体分类性能的两级分类模型,并进一步借助子空间分析建模和划分样本库,获得可靠的难分类病变样本集,从而获得可靠的分类结果。首先,本文提出乳腺良恶性分类的两级分类模型,通过第一级分类中三类特征的判别结果来寻找难分类病变并对常见病变进行分类,接着进行特征选择以融合病灶各类特性,最后对难分类病变进行二次分类。初步获得病变分类的敏感度为94%,特异度为90%,准确率为92%,Matthews相关系数为0.84。分类模型中,难分类病变的筛选是影响最终分类性能的重要因素。因此本论文提出使用子空间分析获取难分类病变样本集。该方法通过使用低秩表示模型来对数据进行聚类,得到其中分布异常的数据,即难分类病变,然后分别对常见病变和难分类病变进行分类。最后获得病变分类的敏感度为100%,特异度为93%,准确率为97%,Matthews相关系数为0.94。实验结果显示,通过子空间分析的方法来寻找难分类病变可以进一步提高乳腺病变的分类性能。本论文研究结果表明,通过减少簇间相关性可以提高聚类性能,并且本论文基于子空间分析在医学影像分析中也获得了理想的效果。