首页 期刊 数据采集与处理 基于两步决策与ε-greedy探索的增强学习频谱分配算法 【正文】

基于两步决策与ε-greedy探索的增强学习频谱分配算法

作者:尹之杰; 汪一鸣; 吴澄 苏州大学轨道交通学院; 苏州215131
认知无线网络   认知基站   频谱管理   动态频谱接入   增强学习  

摘要:在认知无线网络中,认知基站需要进行频谱管理来提升非授权用户的服务质量。基站在寻找频谱空洞分配给非授权用户的过程中,需要做出最好的选择,但极可能是局部最优解,从而造成非授权用户频繁的频谱切换和吞吐率的下降。针对此问题,本文提出基于两步决策与探索的集中式增强学习频谱分配算法。通过设计新型状态动作集,认知基站进行信道分配的两步决策,并应用探索模式,解决认知基站在增强学习过程中探索环境和利用经验进行决策的平衡问题,防止决策的局部最优,提升频谱管理的性能。仿真结果表明,该算法在提升非授权用户吞吐率以及降低频谱切换方面明显优于现有的一些频谱分配策略。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅