关键词:
可重构机器人
微分博弈
人机交互
最优控制
自适应动态规划
摘要:
随着工业4.0进程的不断推进,机器人产业的发展与技术的提升已经成为我国制造业由“劳动密集型”向“技术密集型”转变的重要突破口,担负着国家高新科技实力“弯道超车”的重要使命,对我国经济体制转型与高精尖制造业的发展起到举足轻重的作用。近年来,随着人与机器人共享工作空间的不断增大,人们迫切期待能够与机器人通过密切的肢体接触实现安全、和谐的人机交互(Human-Robot Interaction,HRI),将人的机动性、适应性和解决问题的灵活性与机器人的力量、耐久性和运动的精确性结合起来,精准高效的完成人机交互牵引、装配与运输等工作。可以预见的是,在当前“十四五”规划的指引下,在全面实现“中国制造2025”战略目标的决胜时期,在坚持“以人为本”思想发展机器人产业的进程中,面向人机交互的机器人系统将占据极其重要的战略地位。尽管目前多种机构类型的机器人系统在人机共融环境下作业的安全性与精确性已经得到了极大的提升。然而,现有的面向人机交互的机器人还存在一个共同的缺点,即是难以根据不同的人机交互环境与任务需求来改变自身的构形配置与工作模式,而现有的能够在复杂环境下完成多种人机协同作业任务的机器人大多被设计成具有庞大的尺寸及足够多的自由度,这种设计不但使得机器人造价昂贵,而且会降低机器人的稳定性与控制精度。可重构机器人(Reconfigurable Robot Manipulator,RRM)是一类具有标准模块与接口,可根据不同的任务需求对自身构形进行重新组合与配置的机器人。根据“模块化”与“可重构”的设计理念,可重构机器人的每个关节模块均包含了通讯、传感、驱动、控制等单元,通过对这些模块进行重新配置可以使机器人呈现多种装配构形来完成不同的工作任务,从而表现出传统机器人所不具有的优势。近年来,可重构机器人系统在装配、焊接、涂胶、分拣等工业生产领域已经得到了广泛的应用,更为可喜的是,由于可重构机器人所独有的“结构柔性”及“低成本、高效率、易维护”的特性,使得其尤为适合在深空探测、极地探险、灾害救援等作业任务难以预知、行进载荷受限的复杂环境下完成人和机器人协同作业任务。因此,本文针对基于微分博弈的可重构机器人系统最优人机交互控制方法展开深入的研究以及探讨,全文的主要内容包括:1、阐述了论文的研究背景及意义,对可重构机器人国内外的发展现状及其控制方法等相关技术进行综述。2、考虑可重构机器人系统是否存在谐波传动装置的情况,建立了基于牛顿-欧拉迭代算法以及关节力矩反馈方法的多自由度可重构机器人系统动力学模型,并详细分析其摩擦力、交联耦合项、扰动力矩等性质。针对机器人系统的每一个模块建立其子系统模型并列写状态空间方程,为后续章节的控制方法做出铺垫。3、基于零和微分博弈策略,研究了可重构机器人系统分散自学习优化控制方法。将机器人系统的控制律以及不确定扰动分别作为零和微分博弈中的“局中人”,通过单评判网络策略迭代以及执行-评判-辨识网络得到系统的自学习优化控制策略,并通过李雅普诺夫理论证明系统的稳定性。4、将可重构机器人系统的每一个模块视为非零和博弈中的一个参与者,建立基于模糊逻辑非零和微分博弈的可重构机器人系统近似最优控制策略。采用事件触发机制降低了机器人系统的采样频率,值迭代方法摆脱了传统策略迭代所需的容许控制策略,利用模糊逻辑系统处理未知的机器人动力学模型,并通过执行-评判网络得到耦合的哈密顿-雅克比(Hamilton-Jacobi,HJ)方程的解,从而得到所需求解的近似最优控制律。5、在人机协作任务中,人和机器人系统通过合作共同完成特定任务,根据合作微分博弈策略,将可重构机器人系统的最优控制问题转化为多子系统的合作博弈优化控制问题。采用自适应动态规划(Adaptive Dynamic Programming,ADP)算法,求解人机交互任务下耦合的哈密顿-雅克比-贝尔曼(Hamilton-Jacobi-Bellman,HJB)方程,满足系统的Pareto均衡,进而得到机器人系统的最优控制律。6、针对以人为主导的可重构机器人系统,将人视为领导者,可重构机器人系统作为跟随者,将人机交互最优控制问题转化为基于Stackelberg博弈的分层最优交互控制问题。根据近似动态规划算法,利用评判神经网络分别获得领导者和跟随者的耦合代价函数,从而求取近似最优控制策略。最后对全文的工作进行总结,并对后续研究内容进行展望。