首页 期刊 测控技术 基于强化学习的两轮模型车控制仿真分析 【正文】

基于强化学习的两轮模型车控制仿真分析

作者:晋帅; 李煊鹏; 何嘉颖; 李纾昶; 周敬淞 东南大学仪器科学与工程学院; 江苏南京210096
强化学习   sarsa   gazebo仿真  

摘要:在不同环境中,各种强化学习算法的控制效果存在差异,针对特定环境下算法难以选择的问题,基于Gym与Gazebo搭建了一种强化学习算法仿真的小车平台,使用其对Q-Learning算法、Sarsa算法和DQN算法在两轮模型车的行走控制训练中进行测试验证,利用三种复杂度不同的地图,在训练次数相同的情况下测试算法的有效性与鲁棒性。实验结果与预期符合:Q-Learning算法在较简单的地图中可以使模型车获得较高的奖励;Sarsa算法的稳定性更佳,训练收敛速度更快、效果更优;DQN算法收敛性与鲁棒性最优。该平台提供了一种利用仿真环境模拟实物运动控制的有效方案。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅