关键词:
微分对策
自适应动态规划
最优控制
事件触发控制
拦截制导
广义模糊双曲正切模型
摘要:
随着现代战争形态加速向精确化、信息化、体系化战争演变,具有打击精度高、速度快和射程远等优点的精确制导武器的研究受到世界各国的高度关注。在信息化战争环境下,机动能力强的新型智能目标能够采取主动规避的方式躲避拦截器的拦截,而拦截导弹则通过调整策略使脱靶量最小化,因此导弹和机动目标的攻防过程本质上是一个动态博弈过程。微分对策作为解决双方或多方冲突对抗、竞争问题的有效工具,能够在充分考虑拦截导弹和机动目标之间博弈关系的条件下,研究制导律的设计方法。此外,导弹拦截过程中面临内部扰动、输入饱和约束以及网络带宽受限等难题,为此本文以导弹拦截机动目标为应用背景,以具有在线自学习功能的自适应动态规划(Adaptive Dynamic Programming,ADP)算法为基础,结合最优控制、鲁棒控制、事件触发控制、模糊控制和协同控制等先进控制方法,开展事件触发机制下非线性系统的最优控制问题的研究。具体内容概括如下:
(1)考虑到拦截制导系统内部大量的信息传输和有限的网络带宽之间的矛盾,基于微分对策理论和事件触发控制研究了事件触发机制下的自适应最优制导问题。为了得到事件触发的最优控制策略,构造了时变代价函数处理有限时域约束,并采用事件触发的ADP方法逼近未知的最优代价函数及终端状态约束。与时间触发采样方案相比,所提出的事件触发机制只在事件触发条件被违反时才进行信息传输,有效提高了通信资源的利用率。其次,与传统的评价网-执行网结构不同,本文采用单一的评价网络在线近似最优代价函数及终端约束条件,简化了神经网络的近似结构。利用Lyapunov稳定性定理,证明了在所提出的近似最优控制策略和事件触发条件下,闭环系统状态和评价网络权值近似误差是一致最终有界的。最后,引入一对一拦截制导系统,验证了所提方法的有效性。
(2)考虑拦截制导系统中存在未知动态的情况,提出了即插即用的事件触发模糊自适应最优制导方法。该方法采用广义模糊双曲正切模型(Generalized Fuzzy Hyperbolic Model,GFHM)构造辨识器-评价网络结构,其中在线辨识器用于估计未知动态,同时利用基于GFHM的评价网络逼近最优代价函数和事件触发的最优控制策略。在即插即用框架下,设计的辨识器和评价网络同时运行,去除了先验识别过程,从而简化了神经网络近似结构。利用Lyapunov稳定性定理,证明了推导出的近似最优控制策略和权值更新律能够保证闭环系统和权值逼近误差一致最终有界。最后,以导弹拦截系统为例,比较分析了所提制导方法和传统的ADP制导方法的拦截效果。
(3)考虑拦截制导系统中存在未知动态和内部扰动等问题,针对存在未知动态的不确定仿射非线性系统提出了一种事件触发的鲁棒最优制导方法。首先,基于数据驱动技术设计了一个在线辨识器重构未知的系统动态;并针对重构的非线性系统利用改进的时变代价函数推导出鲁棒最优的控制策略。利用ADP技术,在即插即用结构下设计评价网络在线逼近未知的最优代价函数及终端状态约束。根据Lyapunov稳定性定理,推导出事件触发条件,并证明了闭环系统和评价网络权值近似误差的一致最终有界性,及辨识器权值近似误差的渐近稳定性。最后,在导弹-目标拦截系统中的应用验证了该方法的可行性和有效性。
(4)考虑拦截制导系统存在未知动态、内部扰动和输入饱和约束等问题,针对存在未知动态的不确定仿射非线性系统提出了一种输入饱和条件下的事件触发鲁棒最优制导方法,以实现对机动目标的成功拦截。首先,利用神经网络构造了辨识器估计未知的系统动态;然后针对重构的非线性系统定义了改进的非二次型代价函数,进而推导出输入饱和条件下的鲁棒最优控制策略。为减少制导过程中不必要的数据传输,在控制器设计中引入了事件触发机制。在此机制下,采用广义模糊双曲评价网络逼近最优代价函数及终端约束条件,得到事件触发的近似最优鲁棒控制策略。依据梯度下降法,设计了一种权值更新律以保证权值逼近误差的收敛性,并通过增加一个附加函数来放宽对初始容许控制的要求。最后,通过一对一拦截制导的仿真,验证了所提方法的有效性。
(5)考虑多导弹协同制导过程中可能遇到的网络带宽受限和输入饱和约束等问题,提出了输入饱和条件下的事件触发最优协同制导方法。首先,基于图论和隐式协同制导原理将多弹协同制导问题转化成非线性多智能体系统的最优控制问题,基于局部邻域信息、周期事件触发机制和一个非二次型代价函数推导出输入饱和条件下的事件触发协同最优控制策略以减少制导过程中不必要的数据传输。然后,利用时变的评价网络逼近未知的有限时域最优代价函数及终端状态约束,并建立评价网络的权值更新规律,保证权值逼近误差的收敛性。对Lyapunov函数的分析表明,本文所提方法能够保证局部邻域一致性误差是一致最终有界的。最后,通过一个二对一协同制导的仿真例子验证了所提制导