关键词:
模块化机器人
人机交互
自适应动态规划
迭代学习优化
最优控制
摘要:
当前,全球工业正加速迈向以“人机共融”为特征的新阶段,强调将人类重新融入生产核心,与机器人协同完成高附加值任务。这一趋势不仅聚焦效率提升,更注重发挥人机优势互补,以回应日益增长的个性化生产需求,标志着人机协作将在未来工业发展中发挥关键作用。在人机共融协作任务中,如何提升机器人对人类运动意图的感知能力,已成为交互控制领域亟待突破的关键问题。在人机交互过程中,机器人需实时感知交互力信号,准确识别人类意图,并据此动态调整控制策略,以适应复杂多变的任务环境。模块化机器人凭借其灵活的构形能力与卓越的环境适应性,在这一应用场景中展现出显著优势。探索其在人机交互过程中的优化控制方法,不仅有助于提升协作效率与智能化水平,也为智能制造的转型升级提供了坚实的技术支撑,具有重要的理论价值与工程意义。
因此,本文针对面向共融协作任务的模块化机器人系统迭代学习优化交互控制方法展开深入的研究以及探讨,全文的主要内容包括:
1、阐明了研究的背景与意义,并系统梳理了模块化机器人在国内外的发展现状,重点围绕其控制方法及关键技术进行了综述分析。
2、针对装配谐波传动装置模块化机器人系统,建立了基于关节力矩反馈方法的多自由度动力学模型,并深入分析了系统间的不确定性因素,如摩擦力及交联耦合项等。针对机器人系统的各个模块,构建对应的子系统模型,并列写其状态空间方程,为后续章节的控制方法奠定理论基础。
3、针对短时间人机交互任务且内置谐波减速器的模块化机器人,构建非线性谐波传动柔度模型以进行力矩估计,并结合人类肢体阻抗模型,利用径向基神经网络对人类运动意图进行估计。基于上述信息,依托自适应动态规划理念,将物理人机交互任务转化为最优轨迹跟踪任务。利用单评判神经网络结构进行策略迭代求解哈密顿-雅可比-贝尔曼方程,进而获得最优交互控制律。
4、考虑长时间人机交互任务协作过程中人类操作员的不确定性与任务的复杂程度,为精准估计人类运动意图并确保任务的同步执行,提出基于一维卷积神经网络的执行-评判-辨识结构。执行-评判-辨识结构优势在于学习过程可并行且持续进行,从而提高系统在复杂交互环境下的协同效率。同时,在辨识结构中引入一维卷积神经网络,以利用历史交互数据对人类运动意图进行精准辨识。通过结合时间注意力机制和通道注意力机制,对历史交互数据进行有效特征提取与处理,同时采用自适应矩估计优化方法动态更新网络参数,以提升辨识精度和适应性。基于自适应动态规划方法,利用值迭代的方法求解哈密顿-雅可比-贝尔曼方程以获得最优控制律。
最后对全文研究工作进行了总结,并展望了未来的研究方向。