首页 期刊 自动化与仪表 基于Q(λ)-learning的移动机器人路径规划改进探索方法 【正文】

基于Q(λ)-learning的移动机器人路径规划改进探索方法

作者:王健; 赵亚川; 赵忠英; 张平陆 沈阳新松机器人自动化股份有限公司特种机器人BG; 沈阳110169; .2.沈阳科技学院机械与交通工程系; 沈阳110167
路径规划   强化学习   移动机器人   搜索策略  

摘要:强化学习算法广泛的应用于路径规划,使移动机器人能够与环境交互并实现自主避障、获取最优路径。传统Q(λ)-learning算法所采用的探索策略存在探索利用平衡问题,由于收敛过早,往往得不到最优解。本文提出一种动态调整探索因子的探索方法,以探索成功率判断机器人对环境的熟悉程度,指导探索过程,从而找到最优路径;采用栅格法建立地图。通过仿真和对比试验证明了该方法可以得到全局最优策略。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅