关键词:
非线性滤波
加权平均场系统
随机控制
模型不确定
G-期望
条件强大数定律
摘要:
本文主要研究了一类系数不确定的最优控制问题。系数的不确定性可由多种因素导致,文中讨论了由系统中随机微分方程的漂移项不确定性,扩散项不确定性以及评价体系,即概率环境的不确定性导致的系数不确定的随机控制问题。近年来,越来越多的领域涉及到了随机控制模型,例如AI计算,机器学习,信息过滤,信息传输,投资组合,以及金融衍生品定价等,随机控制模型均在其中发挥着巨大的作用。然而,随着理论与现实问题的紧密结合,完备化模型似乎无法准确地描绘复杂的实际问题。因此对于模型不确定的随机控制问题的研究是急切且关键的。本文旨在不同的导致模型不确定的因素的影响下,寻求最优控制,以解决目标函数达到期望极值的优化问题。同时,本着从实际问题中来,回到实际问题中去的宗旨,本文在得到最优控制的理论解法的同时,论证了在给定信息干扰的前提下的条件强大数定律,为实现最优控制的分支粒子系统表示找到了理论支撑,为数值应用奠定了基础。文章的主要研究内容为:
首先,在传统的概率背景下,本文研究了一类漂移项系数不确定的最优控制问题。该问题具体表现为在一个非线性的随机滤波模型中,信号模型不确定,针对最优控制的决断须依赖不完备的观测信息。此时,模型的不确定性可以由一族概率测度集来刻画。因此,本文提出了一类稳健的最优控制问题,即在最不利的评价体系下,根据不完备的观测信息,找到最优控制使系统承担的代价达到最小值。为了应对该种不确定性,本文采用了最大最小值定理,交换了极值问题的先后次序,于是,此稳健的最优控制问题随即转化为了一类加权条件平均场的最优控制问题。随后,本文证明了该类稳健的最优控制问题中的最优控制的存在唯一性,并利用上述方法对其进行了刻画。
之后,在彭实戈院士首次提出的G期望的理论框架下,本文研究了一类扩散项系数不确定的最优控制问题。扩散项系数的不确定性具体表现为在一个加权平均场系统中,概率环境及驱动随机控制系统的G布朗运动的不确定性。在G期望空间中,G期望是由一族概率测度刻画的,因此许多原本传统概率空间中,依赖概率的可列可加性得到的结论在G期望空间中便无法使用。为了解决这一不确定性,本文利用一类在G期望空间中的导数定义,搭建了G期望与传统数学期望的桥梁,在系数非Lipschitz连续的条件下,得到了G期望空间中的随机最大值原理。
最后,为了给G期望框架下的模糊滤波的分支粒子系统表示提供理论依据与基础,在首次给出条件G容量与G期望下的条件独立同分布的概念下,本文研究了一类在不完备信息的限制下的条件强大数定律。研究表明,在不确定的评价体系中,在部分信息的干扰下,条件独立的样本均值的聚点仍然取值在样本的上下条件期望的区间中;而当样本在部分信息干扰下呈独立同分布性质时,样本均值的聚点则集中在上下条件期望这两点上。这对执行人或投资者理解和预测市场行为,比如通货膨胀模式,资金收益情况及在不完备信息下的金融市场交易都具有重大意义。