【免费】基于模拟退火策略的强化学习路径规划算法-发表之家

基于模拟退火策略的强化学习路径规划算法

作者：季野彪; 牛龙辉西安工程大学电子信息学院; 西安710000

强化学习算法模拟退火路径规划

摘要：针对传统Q(λ)学习算法在解决路径规划问题时,算法收敛速度慢且容易陷入局部最优的问题,提出动态调整探索因子的方法。将模拟退火的思想融入Q(λ)学习算法的动作选择策略中,平衡路径规划中的探索与利用的平衡关系,提出基于模拟退火的Q(λ)学习算法(SA-Q(λ))。学习前期较大探索因子帮助智能体较快的理解环境,避免算法陷入局部最优;学习后期较小的探索因子帮助算法较快地收敛至最优路径。仿真实验表明,改进后的SA-Q(λ)学习算法能够规划出最优路径,且算法收敛速度更快。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询免费咨询杂志订阅

热门期刊服务

国际学生教育管理研究统计与经济计算机教育科技与经济计算机工程与设计计算机技术与发展计算机与生活科技与经济画报农村经济与科技机械设计与制造会计与经济研究工业审计与会计

基于智慧课堂的教与学基于大概念的语文教学基于核心素养的培养基于核心素养的教学方式基于模型的优化设计

现代计算机

影响因子：0.57

期刊级别：省级期刊

发行周期：半月刊

服务介绍

基于模拟退火策略的强化学习路径规划算法

现代计算机

期刊咨询

订阅杂志

期刊推荐