关键词:
列车编队运行
强化学习
最优控制
摘要:
作为轨道交通的重要组成部分,高速铁路在现代交通体系占据至关重要的地位。随着城镇化进程的加快和人口规模的迅速扩大,轨道交通的运输压力日益增加,列车编队运行技术成为主要的解决方案之一。同时,列车的运行阻力受线路条件、风速和雨雪天气等因素影响,大部分因素无法准确预见或测量。列车的运行环境存在强风、雨雪和雷电等现象,会造成不确定扰动。这些因素影响了列车运行安全和运行效率。此外,列车车载子系统的计算资源是有限的,无法满足强化学习算法的庞大计算需求。因此,设计未知动态环境下的列车编队运行确定性强化学习控制方法,具有重要的研究意义。考虑未知动态环境下的列车编队问题,本文估计了列车运行阻力,补偿了时变干扰,设计了基于强化学习的编队控制策略,以性能指标监视器控制强化学习神经网络的开关来降低计算量,实现了多场景下的列车编队运行,其主要研究内容如下:
首先,研究了确定性强化学习下的列车运行最优控制问题。考虑了编队运行的跟踪误差和控制输入,设计了性能指标函数。基于演员-评论家强化学习框架,设计了列车编队运行的最优控制策略。额外设计了性能指标监视器,实现了神经网络在线优化和迭代学习的结合,降低了计算资源的消耗。通过与其他控制方法的仿真对比,验证了该方法的控制性能,实现了列车编队稳定运行。
其次,研究了未知动态环境下的列车运行自适应最优控制问题。设计了自适应神经网络及其更新规律,用于在线估计和补偿列车运行阻力和时变干扰。简化了神经网络结构,设计了新的神经网络控制方案,对于每个控制器采用单个神经网络和权值矩阵进行估计和更新,通过仿真验证了该方案能实现列车编队的自动运行控制。
最后,研究了列车编队重组确定性强化学习一致控制方法。针对实际运行过程中列车编队重组场景,将编队重组概括为不连续参考信号的跟踪控制问题。分析了编队间的通信关系和结构,建立了单车领导下的编队一致性跟踪误差模型。在未知动态环境下,分析了列车编队重组控制策略,设计了确定性强化学习一致控制器,解决了误差放大的问题,实现了特定场景下列车编队的灵活重组和稳定运行。设计了性能指标监视器,保证控制器的稳定和有效,通过仿真实验证明了该方法的有效性。
图31幅,表1个,参考文献85篇。