首页 期刊 系统工程与电子技术 Q-learning强化学习制导律 【正文】

Q-learning强化学习制导律

作者:张秦浩; 敖百强; 张秦雪 北京电子工程总体研究所; 北京100854; 北华航天工业学院计算机学院; 河北廊坊065000
比例制导   制导律   脱靶量   机动目标   强化学习  

摘要:在未来的战场中,智能导弹将成为精确有效的打击武器,导弹智能化已成为一种主要的发展趋势。本文以传统的比例制导律为基础,提出基于强化学习的变比例系数制导算法。该算法以视线转率作为状态,依据脱靶量设计奖励函数,并设计离散化的行为空间,为导弹选择正确的制导指令。实验仿真验证了所提算法比传统的比例制导律拥有更好的制导精度,并使导弹拥有了自主决策能力。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅