关键词:
平均场
正倒向随机微分方程
最优控制
随机最大值原理
传染病
分室模型
生存性
状态约束
摘要:
Pardoux和Peng[73]在1990年首次引入了非线性经典倒向随机微分方程(简称BSDE),并且在Lipschitz假设下证明了非线性BSDE解的存在唯一性。由于他们的开创性工作,BSDE理论得到了迅速的发展,这也得益于它在随机控制、金融和二阶偏微分方程理论等方面的大量应用。对于随机控制问题,随机最大值原理(简称SMP)和Bellman动态规划原理(简称DPP)都是研究最优控制策略的重要方法。关于Bellman动态规划原理的研究,我们可以参考[41]和其中的参考文献。关于随机最大值原理的研究,可以参见,例如,Hu[45]研究了控制状态空间非凸的随机递归最优控制问题,Zhang,Li和Xiong[93]研究了具有部分观测信息的最优控制问题,Wu[87]讨论了具有凸控制状态空间的完全耦合的正倒向随机微分方程(简称FBSDE)的随机控制问题。与此同时,FBSDE理论的研究也在迅速发展,吸引了大量的研究人员,可以参见[6,48,65,74,92].自从Kac[50]在1956年引入了平均场随机微分方程,也称为Mckean-Vlasov方程,平均场问题得到了众多学者的关注。Buckdahn,Djehiche,Li和Peng[18]引入了平均场倒向随机微分方程(简称mean-field BSDE),有关平均场BSDE的更多性质,请参阅[18,58,27].并且,已经有一些研究工作致力于研究平均场型的SMP。例如,Buckdahn,Li和Ma[19]研究了系数依赖于状态过程与其分布的一般平均场随机微分方程(简称mean-field SDE)的最优控制问题,更多的文献可以参见Li[61],Buckdahn,Chen和Li[16],Buckdahn,Djehiche,Li[17]等。随着最优控制理论在生物数学方面的研究不断深入,近年来公众对于健康的更加重视与现代医疗技术的迅速发展,受控传染病分室模型的研究也越来越受到关注。分室模型和与其动力学相关的控制问题已经被广泛研究了几十年,例如[4,9,40,69].一些研究应用最优控制理论,将干预作为控制变量,降低SIR模型的有效传输率,并研究了基于固定有限时域或无限时域内运行和终端成本的最优策略,如Alvarez,Argente和Lippi[1]研究了 SIR模型的一个最小化封锁成本和最佳封锁政策的问题,更多的文献可见[14,37,53,54].最近的贡献集中在具有由重症监护病房(简称ICU)的流动性限制带来的状态约束的情形,试图将屏障理论或生存性理论工具与最优控制问题相结合,使[2](生存性相关技术)、[35]或[81](障碍技术)和一般的研究过程中的“安全”问题统一起来成为研究对象。基于对最优控制以及相关内容的了解,本文主要讨论了两个重要的最优控制问题。第一部分即在第二章讨论了一类平均场耦合正倒向随机微分方程(简称MFFBSDE)及其最优控制问题。在一定的单调性条件下,给出了这类MFFBSDE解的存在性与唯一性定理。在此基础上,讨论了控制域为凸时平均场耦合FBSDE的随机最优控制问题,研究了 Pontryagin最大值原理。我们的方程是更一般的平均场类型,系数不仅依赖于当前时刻的受控解过程(Xt,Yt,Zt),而且还取决于解过程和控制过程(X,Y,v)轨道的分布。并且得到了一个新的变分不等式与相应的Hamilton函数。第二部分即在第三章研究了传染病分室模型的安全域(与生存域)的刻画和最优控制问题。构建了处理受控分室模型的统一理论结构,给出刻画生存域、求解最优控制的一个有效思路,并且着重研究了在传染病死亡和自然死亡均发生的假设下,具有时变人口的SIRD+模型生存域的刻画。基于真实数据进行了案例研究。最后采用粘性方法证明了非药物干预策略(也称之为“贪婪”策略)的最优性。下面我们将进一步阐述本论文的内容和结构。第一章给出了第二章至第三章研究的研究背景及其主要问题。第二章讨论了一类平均场耦合正倒向随机微分方程及其最优控制问题。首先在对于分布仅有连续性的假设下,利用Malliavin导数与Schauder不动点定理证明了定理2.2.1即平均场FBSDE(2.2.2)解的存在性定理,并得到了一类特殊的平均场FBSDE(2.2.25)解的唯一性(定理2.2.2).其次,给出了相应函数空间中关于测度导数的定义,即定义2.3.2,将欧氏空间中关于分布的求导推广到一般的Banach空间。最后,研究了具有凸控制域的受控平均场FBSDE(2.4.1)的最优控制问题,受控系统的系数不仅取决于当前时刻t的解过程(Xt,Yt,Zt),而且还依赖于解过程(X,Y)及控制过程v轨道的分布,由此解(X,Y,Z)是受控的。在相应的假设条件下,证明了相关方程解的存在性和唯一性,而后推导出了本章最重要的研究结果,平均场类型的随机最