首页 期刊 现代计算机 基于模拟退火策略的强化学习路径规划算法 【正文】

基于模拟退火策略的强化学习路径规划算法

作者:季野彪; 牛龙辉 西安工程大学电子信息学院; 西安710000
强化学习   算法   模拟退火   路径规划  

摘要:针对传统Q(λ)学习算法在解决路径规划问题时,算法收敛速度慢且容易陷入局部最优的问题,提出动态调整探索因子的方法。将模拟退火的思想融入Q(λ)学习算法的动作选择策略中,平衡路径规划中的探索与利用的平衡关系,提出基于模拟退火的Q(λ)学习算法(SA-Q(λ))。学习前期较大探索因子帮助智能体较快的理解环境,避免算法陷入局部最优;学习后期较小的探索因子帮助算法较快地收敛至最优路径。仿真实验表明,改进后的SA-Q(λ)学习算法能够规划出最优路径,且算法收敛速度更快。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅