首页 期刊 计算机科学 改进深度确定性策略梯度算法及其在控制中的应用 【正文】

改进深度确定性策略梯度算法及其在控制中的应用

作者:张浩昱; 熊凯 北京控制工程研究所空间智能控制技术部级重点实验室; 北京100190
深度强化学习   深度确定性策略梯度   优先级采样   方向控制  

摘要:深度强化学习往往存在采样效率过低的问题,优先级采样可以在一定程度上提高采样效率。将优先级采样用于深度确定性策略梯度算法,并针对普通优先级采样算法复杂度高的问题提出一种小样本排序的思路。仿真实验结果表明,这种改进的深度确定性策略梯度算法提高了采样效率,具有好的训练效果。将深度确定性策略梯度算法用于小车方向控制,相比于传统的PID控制,该算法避免了人工调整参数的问题,具有更广阔的应用前景。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅