关键词:
时间不一致
闭环均衡策略
线性二次最优控制问题
不定控制加权矩阵
广义Riccati方程
正倒向随机微分方程
闭环均衡策略的存在性
摘要:
线性二次最优控制问题是极其重要的一类最优控制问题,其初期的研究都假设了标准条件(标准条件是指:代价泛函中的控制加权矩阵是一致正定的,其他的加权系数矩阵是半正定的).在标准条件下,这些问题都可以十分简洁地通过Riccati方程的解构造出线性反馈形式的最优控制.之后的大量研究致力于减弱标准条件(特别是关于控制加权矩阵的一致正定性条件),相关结果可参考孙景瑞–雍炯敏的英文专著“Stochastic Linear-Quadratic Optimal Control Theory:Open-Loop and Closed-Loop Solutions”以及其中丰富的参考文献.另一方面,时间不一致线性二次最优控制问题作为对线性二次最优控制问题的推广,在近年来受到广泛关注.已经有许多在标准条件下讨论其闭环均衡策略的研究(参见文献:雍炯敏[*** Related Fields,2011,1:83–118],[***.,2017,369:5467–5523],窦芳芳–吕琦[SIAM *** Optim.,2020,58:485–509]).然而,关于减弱标准条件的研究却相对较少.本学位论文将分别采用多人微分对策方法和变分方法来减弱标准条件,并证明闭环均衡策略的存在性.主要内容可分为以下三个部分.
一.采用多人微分对策来研究一类时间不一致奇异(确定性)线性二次最优控制问题,其中控制加权矩阵可以是奇异的.首先,借助矩阵Moore-Penrose逆的性质证明了奇异线性二次最优控制问题所对应的广义Riccati方程的可解性.然后,利用多人微分对策方法,得到了一族闭环Δ-均衡策略.最后,通过紧性方法,证明了该问题所对应的正倒向Riccati-Volterra积分方程的适定性,并从中构造出了一族闭环均衡策略.
二.采用多人微分对策来研究一类时间不一致奇异随机线性二次最优控制问题,其中控制加权矩阵可以是奇异的.首先,利用可测选取定理和矩阵MoorePenrose逆的一些性质,证明了奇异随机线性二次最优控制问题所对应的广义Riccati方程的可解性.然后,利用多人微分对策方法,得到了一族闭环Δ-均衡策略.接着,通过巧妙的构造和对方程耦合关系的利用,得到了闭环Δ-均衡策略收敛速率的估计,并证明了该问题对应的Riccati方程的适定性.最后,在对区间划分细致处理并取极限之后,验证了所构造的一族策略是闭环均衡策略.
三.采用变分方法来研究正倒向随机微分方程(简称FBSDEs)的时间不一致线性二次最优控制问题,其中控制加权矩阵可以是不定的或奇异的.首先,通过引入伴随方程和利用方程解耦的技巧,得到了一族耦合的Lyapunov方程,并用其来精确刻画代价泛函的扰动.然后,结合一些稳定性和收敛性分析,得到了该问题闭环均衡策略的一个等价刻画.最后,我们将该结果应用于时间不一致随机线性二次最优控制问题,得到了其闭环均衡策略存在的充要条件.