首页 期刊 湖南理工学院学报·自然科学版 平均排队长度差最小的单交叉口在线Q学习模型 【正文】

平均排队长度差最小的单交叉口在线Q学习模型

作者:张术; 韦钦平 长沙理工大学交通运输工程学院; 长沙410004
交通控制   配时优化   排队长度   在线q学习  

摘要:建立了以平均排队长度差最小为优化目标的在线Q学习模型.针对控制性能指标相对于临近的配时方案不敏感的特点,提出了以平均排队长度差作为基本单位重新构造奖励函数,目的是拉大各行为对应的Q值差距,提高模型的收敛速度和鲁棒性.集成ExcelVBA、Vissim、Matlab建立了在线仿真平台,作为计算环境对模型进行了计算.利用GPS数据对Vissim软件中车辆加减速度曲线进行了标定.计算结果表明以平均排队长度差作为优化目标能够优化整个交叉口的时空资源,本文建立的在线Q学习模型具有较快的收敛速度和鲁棒性,通过学习能够实现优化目标.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅