【免费】改进深度确定性策略梯度算法及其在控制中的应用-发表之家

改进深度确定性策略梯度算法及其在控制中的应用

作者：张浩昱; 熊凯北京控制工程研究所空间智能控制技术部级重点实验室; 北京100190

深度强化学习深度确定性策略梯度优先级采样方向控制

摘要：深度强化学习往往存在采样效率过低的问题,优先级采样可以在一定程度上提高采样效率。将优先级采样用于深度确定性策略梯度算法,并针对普通优先级采样算法复杂度高的问题提出一种小样本排序的思路。仿真实验结果表明,这种改进的深度确定性策略梯度算法提高了采样效率,具有好的训练效果。将深度确定性策略梯度算法用于小车方向控制,相比于传统的PID控制,该算法避免了人工调整参数的问题,具有更广阔的应用前景。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询免费咨询杂志订阅

热门期刊服务

教育研究与评论·课堂观察首都医科大学学报·社科版教育研究与评论·小学教育教学雷达与对抗冶金设备管理与维修临床普外科电子集美大学学报·自然科学版大学物理实验高校辅导员学刊安徽农学通报·下半月刊电击高手近代中国与文物

改进工作作风心得体会

计算机科学

影响因子：0.94

期刊级别：北大期刊

发行周期：月刊

服务介绍

改进深度确定性策略梯度算法及其在控制中的应用

计算机科学

期刊咨询

订阅杂志

期刊推荐