摘要:深度强化学习往往存在采样效率过低的问题,优先级采样可以在一定程度上提高采样效率。将优先级采样用于深度确定性策略梯度算法,并针对普通优先级采样算法复杂度高的问题提出一种小样本排序的思路。仿真实验结果表明,这种改进的深度确定性策略梯度算法提高了采样效率,具有好的训练效果。将深度确定性策略梯度算法用于小车方向控制,相比于传统的PID控制,该算法避免了人工调整参数的问题,具有更广阔的应用前景。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
热门期刊服务
教育研究与评论·课堂观察 首都医科大学学报·社科版 教育研究与评论·小学教育教学 雷达与对抗 冶金设备管理与维修 临床普外科电子 集美大学学报·自然科学版 大学物理实验 高校辅导员学刊 安徽农学通报·下半月刊 电击高手 近代中国与文物相关文章
改进工作作风心得体会