首页 期刊 计算机工程 多步截断优先扫描强化学习算法 【正文】

多步截断优先扫描强化学习算法

作者:李春贵 广西工学院计算机工程系,柳州545006
强化学习   优先扫描   多步截断   markov过程  

摘要:研究了优先扫描的强化学习方法,通过定义新的迹,把多步截断即时差分学习用于集成规划的优先扫描强化学习,用多步截断即时差分来定义扫描优先权,提出一种改进的优先扫描强化学习算法并进行仿真实验,实验结果表明,新算法的学习效率有明显的提高.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅