【免费】基于神经网络的强化学习算法实现倒立摆控制-发表之家

基于神经网络的强化学习算法实现倒立摆控制

作者：张涛; 吴汉生中国科学技术大学自动化系; 安徽合肥230027

强化学习神经网络激活函数泛化性能连续动作空间

摘要：运用强化学习的方法来对连续的倒立摆系统实现平衡控制是一直以来有待解决的问题。该文将Q学习与神经网络中的BP网络、S激活函数相结合，利用神经网络的泛化性能，设计出一种新的学习控制策略，通过迭代和学习过程，不但能够解决倒立摆系统连续状态空间的输入问题，还成功解决了输出连续动作空间的问题。将此方法运用于连续倒立摆系统的平衡控制中，经过基于实际控制模型的Matlab软件仿真实验，结果显示了这个方法的可行性。该方法进一步提高了强化学习理论在实际控制系统中的应用价值。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询免费咨询杂志订阅

热门期刊服务

科技与经济统计与经济计算机教育计算机与信息技术数值计算与计算机应用计算机工程与设计计算机技术与发展计算机辅助设计与制造电气技术与经济交通与计算机机械科学与技术审计与经济研究

基于大概念的语文教学基于智慧课堂的教与学基于核心素养的培养基于核心素养的教学方式基于模型的优化设计

计算机仿真

影响因子：0.51

期刊级别：北大期刊

发行周期：月刊

服务介绍

基于神经网络的强化学习算法实现倒立摆控制

计算机仿真

期刊咨询

订阅杂志

期刊推荐