首页 期刊 计算机仿真 基于神经网络的强化学习算法实现倒立摆控制 【正文】

基于神经网络的强化学习算法实现倒立摆控制

作者:张涛; 吴汉生 中国科学技术大学自动化系; 安徽合肥230027
强化学习   神经网络   激活函数   泛化性能   连续动作空间  

摘要:运用强化学习的方法来对连续的倒立摆系统实现平衡控制是一直以来有待解决的问题。该文将Q学习与神经网络中的BP网络、S激活函数相结合,利用神经网络的泛化性能,设计出一种新的学习控制策略,通过迭代和学习过程,不但能够解决倒立摆系统连续状态空间的输入问题,还成功解决了输出连续动作空间的问题。将此方法运用于连续倒立摆系统的平衡控制中,经过基于实际控制模型的Matlab软件仿真实验,结果显示了这个方法的可行性。该方法进一步提高了强化学习理论在实际控制系统中的应用价值。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅