关键词:
倒向随机微分方程
推广的倒向随机微分方程
动态规划原理
推广的倒向随机变分不等式
最优控制
Wasserstein度量
粘性解
摘要:
推广的倒向随机微分方程,对比一般情形下的倒向随机微分方程,其方程表达式中添加了一个关于递增过程的积分项,我们可将其应用于最优控制领域,使控制系统的性能指标实现最优化,从而解决从一切可能的控制方案中寻找最优解的复杂问题,进一步丰富求解最优控制问题的方法与内容。推广的倒向随机微分方程首次是由Pardoux和Zhang[1]在1998年提出来的,他们还研究了相关的带有非线性Neumann边界条件的偏微分方程问题。2015年,Li和Tang[2]研究了带有递归代价泛函的反射随机动力系统的最优控制问题,并研究了相关的带有非线性Neumann边界条件的Hamilton-Jacobi-Bellman 方程。2017 年,Pardoux 和 Rǎscanu[3]研究了推广的带有非线性Neumann边界条件的抛物型方程解的连续性。2020年,Feng[4]研究了推广的平均场倒向随机微分方程以及相关的带有非线性Neumann边界条件的抛物型偏微分方程问题。本文在前人工作基础上,主要研究了平均场情形下推广的倒向随机微分方程以及推广的倒向随机变分不等式,研究解的性质,与之相关的偏微分方程问题以及在最优控制方面的应用。具体可分为以下三个部分。第一部分(第三章):研究一般情形下推广的平均场倒向随机微分方程解的存在唯一性及比较定理,即此时方程的系数不仅依赖于解的状态,也非线性地依赖于解的分布。具体来说,考虑如下方程:其中K为实值连续递增过程满足一定的可积性条件,在Lipschitz条件和单调条件假设下,我们利用不动点定理,证明了方程(0-1)解的存在唯一性,并在一定条件下利用It(?)-Tanaka公式证明了相应的比较定理,同时给出关于比较定理的两个例子,来说明要求K相同以及系数f不依赖于Z的分布的必要性。第二部分(第四章):对任意的(t,x)∈[0,T]×D和(x0,u)∈D×Ut,T,考虑以下平均场情形下的推广的倒向随机微分方程:其中X0,x0;u,Xt,x;u分别为如下反射SDE的解:其中Ut,T表示[t,T]上的可容许控制集,D是Rd的开连通有界凸子集,W(t,x):=(?)Ytt,x;u为控制问题的值函数。我们考虑下列带有非线性Neumann边界条件的HJB方程:其中在x∈(?)D,(?),X0,x0;u是初始时刻t=0,初始值为x0和给定控制u∈U0,T的反射随机微分方程(0-3)的解,且Hamiltonian函数H定义为:其中(t,x,y,p,A)∈[0,T]× Rd × R ×Rd × Sd,Sd为所有d × d维对称矩阵的集合。在Lipschitz条件和单调条件假设下,首先利用Picard迭代证明了方程(0-2)解的存在唯一性和比较定理,并结合动态规划原理证明了值函数W是方程(0-4)的唯一的粘性解。第三部分(第五章):考虑以下推广的平均场倒向随机变分不等式:其中K为实值连续递增过程满足一定的可积性条件,我们研究了变分不等式(0-5)解的存在唯一性以及相应的比较定理。定义随机域:考虑以下偏变分不等式系统:其中算子lt定义为:ltu(t,x)=1/2tr{E[σ(t,Xt0,x0,x)]E[σT(t,Xt0,x0,x)]D2u(t,x)}+.偏变分不等式(0-6)中的φ,ψ:Rm→(-∞,+∞]为合适的凸下半连续函数。多值次微分算子(?)φ定义为:(?)φ(y):={y∈Rm:{y,v-y)+φ(y)≤φ(v),(?)v∈Rm},(?)ψ类似定义。在Lipschitz条件和单调条件假设下,证明了 u关于(t,x)是连续的,并结合Ishii引理证明了u是偏变分不等式(0-6)的唯一粘性解。