【免费】基于逆强化学习的示教学习方法综述-发表之家

基于逆强化学习的示教学习方法综述

作者：张凯峰; 俞扬计算机软件新技术国家重点实验室(南京大学); 南京210023

强化学习示教学习逆强化学习马尔可夫决策过程多步决策问题

摘要：随着强化学习在自动机器人控制、复杂决策问题上的广泛应用,强化学习逐渐成为机器学习领域中的一大研究热点.传统强化学习算法是一种通过不断与所处环境进行自主交互并从中得到策略的学习方式.然而,大多数多步决策问题难以给出传统强化学习所需要的反馈信号.这逐渐成为强化学习在更多复杂问题中实现应用的瓶颈.逆强化学习是基于专家决策轨迹最优的假设,在马尔可夫决策过程中逆向求解反馈函数的一类算法.目前,通过将逆强化学习和传统正向强化学习相结合设计的一类示教学习算法已经在机器人控制等领域取得了一系列成果.对强化学习、逆强化学习以及示教学习方法做一定介绍,此外还介绍了逆强化学习在应用过程中所需要解决的问题以及基于逆强化学习的示教学习方法.

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询免费咨询杂志订阅

热门期刊服务

科技与经济统计与经济计算机教育计算机与信息技术计算机工程与设计计算机技术与发展数值计算与计算机应用计算机辅助设计与制造电气技术与经济机械科学与技术审计与经济研究制造技术与机床

基于大概念的语文教学基于智慧课堂的教与学基于核心素养的培养基于核心素养的教学方式基于模型的优化设计

计算机研究与发展

影响因子：2.65

期刊级别：北大期刊

发行周期：月刊

服务介绍

基于逆强化学习的示教学习方法综述

计算机研究与发展

期刊咨询

订阅杂志

期刊推荐