首页 期刊 计算机研究与发展 面向Option的k-聚类Subgoal发现算法 【正文】

面向Option的k-聚类Subgoal发现算法

作者:王本年; 高阳; 陈兆乾; 谢俊元; 陈世福 南京大学计算机软件新技术国家重点实验室; 南京210093; 铜陵学院计算机科学与技术系; 铜陵244000
分层强化学习   option   子目标  

摘要:在学习过程中自动发现有用的Subgoal并创建Option,对提高强化学习的学习性能有着重要意义.提出了一种基于k-聚类的Subgoal自动发现算法,该算法能通过对在线获取的少量路径数据进行聚类的方法抽取出Subgoal.实验表明,该算法能有效地发现所有符合要求的Subgoal,与Q-学习和基于多样性密度的强化学习算法相比,用该算法发现Subgoal并创建Option的强化学习算法能有效提高Agent的学习速度.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅