摘要:为解决行为动力学与滚动窗口法的全局路径不是最优的问题,提出在线的基于强化学习的行为动力学与滚动窗口路径规划方法.应用Q学习优化行为动力学模型参数以提高其性能;行为动力学引导Q学习的搜索过程,提高学习效率;每一轮强化学习的动作选择知识随着Q表更新的同时逐渐修正,对后面的学习过程进行优化.仿真实验表明,该方法使得Q学习效率有明显提高,且机器人在线规划出优化平滑的路径.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
热门期刊服务
影响因子:0.47
期刊级别:统计源期刊
发行周期:双月刊
期刊在线咨询,1-3天快速下单!
查看更多>
超1000杂志,价格优惠,正版保障!
一站式期刊推荐服务,客服一对一跟踪服务!