首页 期刊 计算机工程与应用 基于强化学习的无人坦克对战仿真研究 【正文】

基于强化学习的无人坦克对战仿真研究

作者:徐志雄; 曹雷; 陈希亮 解放军理工大学指挥信息系统学院; 南京210000
多动机引导   q学习   sarsa学习   无人坦克   对战仿真  

摘要:对标准的强化学习进行改进,通过引入动机层,来引入先验知识,加快学习速度。策略迭代选择上,通过采用“同策略”迭代的Sarsa学习算法,代替传统的“异策略”Q学习算法。提出了基于多动机引导的Sarsa学习(MMSarsa)算法,分别和Q学习算法、Sarsa学习算法在坦克对战仿真问题上进行了三种算法的对比实验。实验结果表明,基于多动机引导的Sarsa学习算法收敛速度快且学习效率高。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅