【免费】基于强化学习的无人机自主机动决策方法-发表之家

基于强化学习的无人机自主机动决策方法

作者：孙楚; 赵辉; 王渊; 周欢; 韩瑾空军工程大学航空航天工程学院; 西安710038; 汾西重工有限责任公司; 太原030027

无人作战飞机机动决策强化学习连续动作神经网络

摘要：提出了一种基于连续动作集强化学习的无人机机动决策方法。通过Actor-Critic强化学习构架下的NRBF神经网络输出状态真实效用值与连续动作控制变量,效用值与动作控制变量的输出层共用隐层以简化网络结构。结合相对熵理论设计隐层节点的自适应调整方法,有效减少了隐层节点数目。对输出动作控制变量,采用基于高斯分布的连续动作选择策略,并依据训练次数调整随机动作控制变量的概率分布,提升了网络对未知策略的探索能力。在3种不同空战态势下的仿真验证了该方法的有效性,结果表明该方法生成的策略鲁棒性较强,动作控制量更加精确。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询免费咨询

热门期刊服务

科技与经济统计与经济计算机教育计算机与信息技术数值计算与计算机应用计算机工程与设计计算机技术与发展计算机辅助设计与制造电气技术与经济机械科学与技术审计与经济研究制造技术与机床

基于大概念的语文教学基于智慧课堂的教与学基于核心素养的培养基于核心素养的教学方式基于模型的优化设计

火力与指挥控制

影响因子：0.31

期刊级别：北大期刊

发行周期：月刊

服务介绍

基于强化学习的无人机自主机动决策方法

火力与指挥控制

期刊咨询

订阅杂志

期刊推荐