关键词:
贝叶斯网络
分层贝叶斯建模
参数学习
权重判别模型
混沌量子粒子群
变分推理
摘要:
贝叶斯网络作为一种经典的机器学习算法,具有直观的模型,计算简便,被逐渐应用于数据挖掘的研究中。从贝叶斯网络学习的方向来看,分为结构学习和参数学习,本文主要针对后者进行研究。从学习的目的性来看,分为生成学习和判别学习。在实际分类过程中,由于生成学习与分类目标不一致,导致分类精度下降。为了解决分类精度下降的问题,近年来对判别学习的研究逐渐增加。但判别学习的计算过程较为复杂,处理复杂贝叶斯网络时学习效率下降,且不适合处理小数据样本分类。本文针对上述问题,对贝叶斯网络的参数学习方法进行改进。本文的研究内容如下:在当前贝叶斯网络分类器最常用的生成学习方法中,针对优化对数似然函数的结果与分类目标不一致的问题,在类条件贝叶斯网络的基础上,通过重新参数化,提出一种判别类条件贝叶斯网络参数学习方法,直接以条件对数似然函数为优化目标,应用量子行为粒子群优化算法进行求解。该方法直接解决后验分布的参数估计问题,具有较高的分类精度。针对判别学习方法处理大规模数据样本时,存在迭代次数过多,训练时间长且容易陷入局部最优解等问题,引入指数级参数,提出一种混沌量子粒子群的权重类条件贝叶斯网络参数学习方法。该方法通过在类条件贝叶斯网络模型中的参数的指数位置上引入权重参数,建立权重类条件贝叶斯网络模型,并通过混沌量子粒子群算法进行优化求解。改进的算法能够有效减少迭代次数,缩短模型训练时间,同时也提高了算法跳出局部最优解的能力。针对传统的最大似然函数法处理稀疏数据样本时,存在分类精度低,参数估计误差较大的问题,提出一种分层贝叶斯网络建模方法。通过在传统的多项式-狄利克雷模型中引入超先验,构建出分层多项式-狄利克雷模型用于贝叶斯网络的参数估计问题,并使用变分推理算法对模型进行求解。改进的方法能够有效提高分类精度和参数估计精度,且大幅缩短了模型的训练时间。设计开发基于贝叶斯网络分类器的参数学习工具,在.NET框架下,对该工具进行需求分析、整体构架和详细设计等开发过程,主要实现包括数据库导入、特征属性分析、训练模式选择、贝叶斯网络模型建立与测试、分类结果显示等功能。最后以液体火箭发动机的故障诊断为应用对象,对工具的主要功能进行实际测试,验证工具的实用性和有效性。