首页 期刊 计算机工程 强化学习中的时间差分法在用户学习方面的应用 【正文】

强化学习中的时间差分法在用户学习方面的应用

作者:陈俊杰; 张必勇; 宋瀚涛; 陆玉昌; 余雪丽 北京理工大学计算机系; 北京; 100081; 太原理工大学计算机系; 太原; 030024; 太原理工大学计算机系; 太原; 030024; 北京理工大学计算机系; 北京; 100081; 清华大学计算机系; 北京; 100084
强化学习   时间差分法   用户agent   用户模型   向量表示  

摘要:随着Internet上信息量的与日俱增,用户查找自己感兴趣的信息变得越来越困难.文章提出了一种使用强化学习中的时问差算法来学习用户的新学习算法,并通过实验与其它学习方法作了比较,取得了明显的成效.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅