关键词:
四旋翼无人机
视觉伺服
自适应动态规划
时变系统
最优控制
摘要:
视觉伺服是机器人研究的一个重要分支,四旋翼无人机作为一类特殊的机器人,基于其灵活性强、可垂直升降等优良特性,在现实生活中的应用十分广泛。然而,由于四旋翼的动力学特性复杂,且图像特征的选取具有难度,导致实现四旋翼的视觉伺服控制并不简单。ADP(自适应动态规划,Adaptive Dynamic Programming)作为一类特殊的强化学习算法,同样是通过智能体与环境进行交互、不断学习策略实现奖励最大化的智能算法,可以与最优控制理论有效结合,进而对具有复杂动力学特性的系统实现运动控制。本文旨在构建四旋翼IBVS(基于图像的视觉伺服,Image-Based Visual Servoing)模型,并考虑模型中存在的视场约束和外部扰动,致力于设计高效、稳定的控制器,以完成四旋翼的视觉伺服任务。为此,需要解决四旋翼IBVS模型的强耦合、非线性和时变HJB(哈密尔顿-雅可比-贝尔曼,Hamilton-Jacobi-Bellman)方程的求解问题。具体而言,本文的主要工作包括以下几个方面:
(1)四旋翼IBVS模型的构建与处理
提取目标图像的图像矩作为图像特征,并利用透视投影模型,建立图像动力学。将图像动力学模型与四旋翼动力学模型相结合,得到四旋翼IBVS模型。但该模型仍具有强非线性,因而将其拆分为横向、高度和偏航方向的子系统,分别进行控制设计,实现完整动力学的解非线性处理。在小角度近似原理的应用下,高度和偏航子系统均被描述为易于求解的线性系统形式,横向子系统则可视为时变系统,时变项由高度和偏航子系统中的相关变量引入。三个子系统均转化为易于控制的形式,大大降低了控制器设计难度。
(2)针对视场约束的视觉伺服控制
研究视觉伺服问题的基础是确保机载相机始终能够捕捉到目标物体,因此需要对视场进行约束。为了解决系统中视场约束的问题,提出了一类基于时变ADP的四旋翼视觉伺服控制算法。在视觉伺服控制器的设计中,主要考虑对横向子系统的控制设计,将其转化为带输入约束的最优控制问题,并选取非二次型的效用函数,以双曲正切函数将输入限制在既定范围内。为了求解最优控制律,需要求解时变HJB方程,本文利用改进的时变神经网络结构近似时变最优值函数,并设计合适的权值更新律,得到近似最优控制律,进而完成四旋翼IBVS系统的控制设计。最后,通过稳定性证明和仿真验证结果,验证了该方法的有效性。
(3)针对不确定扰动的串级鲁棒保成本视觉伺服控制
在四旋翼无人机的飞行过程中,系统会受到环境因素的影响,从而引入不确定扰动。为了提高四旋翼的鲁棒性,考虑不确定扰动力对系统的影响,提出了一类基于ADP的串级鲁棒保成本控制算法。首先,构建横向子系统图像特征误差-速度双环结构,并将其转化为鲁棒最优保成本控制问题求解。通过在代价函数中引入一个有界函数,保证由系统不确定性引起的系统性能退化小于这个界,进而最小化不确定性对系统的影响。再利用时变神经网络的函数逼近性质,求解鲁棒近似最优控制律,并给出系统的稳定性证明和仿真验证结果。
图25幅,表1个,参考文献89篇