关键词:
反射倒向随机微分方程
混合递归零和微分博弈问题
扩散型控制
混合递归最优控制问题
最优控制的充分条件
泊松停止约束
惩罚倒向随机微分方程
最优停止问题值函数的倒向随机微分方程表示
摘要:
随机微分递归效用是对经典可加效用的一个推广,其不仅依赖于消费、投资等控制过程,而且依赖于将来的效用.1992年,Duffie和Epstein[27]首次提出并研究了此类效用函数.在此之后,递归效用被广泛应用到经济、金融等领域.随后,El Karoui,Peng和Quenez[38]从倒向随机微分方程的角度对其进行重新阐述,并将其作为最优控制问题的代价泛函应用到随机控制中.由此,随机递归最优控制问题逐渐成为一个新的研究热点.反射倒向随机微分方程,也叫带障碍约束的倒向随机微分方程,是在倒向随机微分方程的基础上,通过引入一个连续增过程使得方程的解的第一个分量始终保持在给定障碍过程的上方.其也可通过一列特殊的倒向随机微分方程,即惩罚倒向随机微分方程渐进给出.当信息流包含跳过程的信息或障碍过程带跳时,反射倒向随机微分方程的解的第一个分量或其增过程不再是连续过程,而是对应地转变成带跳的过程.障碍约束条件使得反射倒向随机微分方程与最优停止问题有很好的对应关系,并可用反射倒向随机微分方程的解来刻画最优停时和解决既含有控制策略又带有停止时间的混合最优控制问题,这使得反射倒向随机微分方程得到了人们的持续关注和深入研究.本篇论文在前人研究的基础上,结合零和微分博弈、扩散型控制和泊松停止约束,就几类与反射倒向随机微分方程和递归效用相关的最优化问题做进一步的研究,分别给出对应模型下鞍点策略的充分条件、最优控制的充分条件和最优停止问题值函数的倒向随机微分方程表示.论文的具体结构如下:第一章,介绍了本论文的研究背景和主要学术贡献.第二章,研究了一类带有双边障碍约束的随机递归零和微分对策问题,其递归效用函数由一个双边反射倒向随机微分方程的解给出.该倒向随机微分方程通过终端条件、生成元和双边障碍过程与一个正向随机微分方程相耦合.基于一定的假设,本章给出了该微分博弈问题鞍点策略的一个充分条件.随后,基于双边反射倒向随机微分方程和Dynkin博弈问题的对应关系,我们利用上述结果得到了一类随机混合递归微分博弈问题鞍点混合策略的一个充分条件,并在一定的假设条件下显式的给出了线性混合递归微分博弈问题的鞍点策略和鞍点条件下对应的停时.相较于已有的随机混合递归微分博弈问题,我们研究的系统是随机系数的且其扩散项系数可以显式地含有控制策略变量.而且在本章所研究的停止机制中,提前终止系统而触发的终端代价过程和状态过程有关,进而该代价过程也会受到控制策略的影响.该结果可用于解决一类带有赎回和回售条款的可转换债券的定价问题.最后.我们引入一个数值模拟例子.由双边反射倒向随机微分方程和非线性偏微分方程的双边障碍问题之间的对应关系,我们可以借助有限差分方法来处理该例子,进而验证本章的理论结果.第三章,研究了一类带有障碍约束和扩散型控制的随机递归最优控制问题,其代价泛函由一个带有常规正则控制和扩散型控制的反射倒向随机微分方程给出.扩散型控制是一个局部有界变差的右连续且存在左极限的过程,由Lebesgue分解可知,其可被分解为一个奇异部分和一个纯跳部分.前者可被看做是一个奇异控制,而后者对应一个脉冲控制.扩散型控制的纯跳部分可能会给反射倒向随机微分方程带来一些跳.同时,考虑到右连续且存在左极限的障碍过程以及障碍约束条件,我们不再要求反射倒向随机微分方程中的增过程是连续的,而是将其设定为右连续且存在左极限的以使其能用来抵消扩散型控制项带来的部分负向跳跃,进而得到带有扩散型控制的反射倒向随机微分方程的解的存在唯一性.接着,我们建立带障碍约束的随机递归最优扩散型控制问题,并给出其最优常规正则控制和扩散型控制的一个充分条件.随后,我们验证了带有扩散型控制的混合递归最优控制问题和带有障碍约束的递归最优扩散型控制问题之间的对应关系,得到了该混合最优控制问题最优混合控制的一个充分条件.最后,我们引入一类带有扩散型控制的线性混合递归最优控制问题来验证本章的理论结果,并给出最优停时、最优常规正则控制、最优脉冲发生时刻和最优扩散型控制的显式形式.该结果可用于解决一类含有连续和瞬时消费过程的效用最大化问题.第四章,专注于带有泊松停止约束的随机递归最优停止问题,其中的泊松停止约束是指仅允许参与者在那些泊松随机干预时间上选择是否提前终止系统.首先,我们给出该带约束的递归最优停止问题和相关的带跳的惩罚倒向随机微分方程.我们仅考虑一列特殊的外生停止时间序列,即泊松到达时,因为其具有良好的概率性质而且与惩罚方程中惩罚项的乘子十分契合.泊松停止约束使得递归效用满足的方程中带有跳.并且该方程不再仅由布朗运动驱动,而是由布朗运动和泊松过程共同驱动的.事实上.此时的递归效用函数是由一个定义在随机时间区间上的倒向随机微分方程描述的,该方程带有一个由泊松过程诱导出的随机跳测度.而且,此时泊松随机过程的干扰可能会渗透进动态系统的系数中.