关键词:
技能学习
示教学习
最优控制
动态运动基元
黎曼流形空间
多元信息融合
摘要:
随着新时代全球社会的全面加速发展,机器人行业在社会生产的地位逐渐提升。目前机器人已被广泛应用于汽车领域,3C电子领域等以重复性工作为主的任务场景当中,其中通过手工示教盒标定的方法是人向机器人传递技能的主要方法。然而,在复杂任务场景中,该方式会极大地消耗人力并且对人员的专业能力要求高,另外对单一场景的标定无法推广应用到多变的任务场景。因此,如何将人类的操作技能更高效、快速、准确地传递给机器人是目前亟待解决的科学问题。依照人类的学习过程,机器人技能操作知识的增长问题可被分为技能传递,技能学习以及技能泛化三大核心问题,其中技能学习与技能泛化是机器人技能增长的关键。
本文针对机器人技能学习与技能泛化科学问题,以模仿学习方法为基础,结合最优控制策略,研究机器人对人类典型操作技能学习的技术方法。以末端点位运动技能学习研究为起点,研究在任务约束下的操作运动学习与泛化问题,并延伸到对人类操作关节构型的模仿和操作性能优化问题中,最后解决面向位姿-力信息融合的复杂操作技能学习问题。本文主要研究内容包括以下四方面:(1)基于全局特征整合与泛化的末端点位运动技能学习研究;(2)基于空间几何约束的连续运动技能学习研究;(3)基于人类操作工具特征的关节构型摆位技能的学习研究(4)位姿-力信息融合的操作技能学习研究。
首先,针对在单一任务情景中,动态运动基元方法无法准确地提取运动特征的问题及无法实现全局模仿泛化的问题。本文采用了多元高斯过程回归方法优化动态运动基元模型,实现对多组示教运动特征的整合,提高了动态运动基元方法在多任务情景中学习及泛化的能力。之后,提出一种基于欧式变换的动态运动基元优化方法,实现空间全局的运动模仿泛化。
其次,针对被操作物体的几何特性会对人类行为决策产生影响问题。通过对人类操作运动分析发现,仅在笛卡尔坐标系空间难以精确表达受被操作对象几何形状或几何约束影响运动的特征分布。本文基于黎曼流形空间,采用多种类坐标系统融合的方法表征人类示教运动,构建人类示教运动的高斯分布来提取任务几何约束与操作运动特征关系模型。在运动泛化阶段,泛化生成具备抵抗外界扰动的操作运动来完成任务。
再次,针对传统的技能学习研究忽略了操作过程中人体操作关节构型变化的问题。本文以冲击任务中工具使用为研究背景,深入探讨了不同关节构型对操作的影响。引入了方向可操作性能指标,以量化工具操作末端在指定方向上的操纵能力。采用基于交叉方向乘子法的迭代二次型最优控制方法,使得工具的抓握姿态以及执行冲击动作的关节构型更贴近于人类操作习惯,以实现沿特定方向最大化工具操作的能力。
之后,由于多元信息融合学习与泛化问题是对人类复杂操作技能学习的关键,本文以圆轴孔装配任务作为研究背景,针对存在位置、姿态、交互力信息融合的复杂操作技能的学习问题,提出一种基于方向角的装配姿态表征方法。并提出一种动态约束动态运动基元方法实现对装配姿态的学习与泛化。采用径向基神经网络对整合的交互力信息进行学习,进一步提高了力-力矩信息的预测的精确度。最后,构建位姿-力信息融合的模仿学习系统框架,提高了机器人对装配技能学习的准确性和高效性。
最后,设计了针对人类典型操作技能学习的综合实验。通过书写、擦拭等技能学习实验,验证了优化后的动态运动基元方法在多运动特征整合及全局模仿的有效性。通过抓取多种类物体以及开启箱子技能学习实验,验证了在空间几何约束下的运动泛化方法的稳定性和柔顺性。通过锤击动作关节构型模仿实验,验证了提出的方法对人类操作工具关节摆位技能学习的有效性及应用的灵活性。通过圆轴孔装配技能学习实验,验证了本文提出的多元信息融合的模仿学习框架下,对装配技能学习的高效性及有效性。