首页 期刊 计算机研究与发展 基于随机博弈与改进WoLF-PHC的网络防御决策方法 【正文】

基于随机博弈与改进WoLF-PHC的网络防御决策方法

作者:杨峻楠; 张红旗; 张传富 中国人民解放军战略支援部队信息工程大学; 郑州450001
随机博弈   网络攻防   防御决策   有限理性  

摘要:当前运用随机博弈的网络攻防分析方法采用完全理性假设,但在实际的网络攻防对抗中攻防双方很难达到完全理性的高要求,降低了现有方法的准确性和指导价值.从网络攻防对抗实际出发,分析有限理性对攻防随机博弈的影响,在有限理性约束下构建攻防随机博弈模型.针对网络状态爆炸的问题,提出一种基于攻防图的网络状态与攻防动作提取方法,有效压缩了博弈状态空间.在上述基础上引入强化学习中的WoLF-PHC算法进行有限理性随机博弈分析并设计了具有在线学习能力的防御决策算法.该算法通过学习可以获得针对当前攻击者的最优防御策略,所得策略在有限理性下优于现有攻防随机博弈模型的纳什均衡策略.通过引入资格迹改进WoLF-PHC算法,进一步提高了防御者的学习速度.通过实验验证了所提方法的有效性与先进性.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅