基于强化学习算法的公交信号优先策略
来源期刊:东北大学学报(自然科学版)2012年第10期
论文作者:舒波 李大铭 赵新良
文章页码:1513 - 1516
关键词:公交系统;交通信号控制;公交信号优先;强化学习;回报函数;
摘 要:综合分析了影响城市公共交通系统运行的多种因素,提出了一种新型的基于强化学习算法的城市公交信号优先控制策略.该策略利用强化学习算法的试错-改进机制,根据不同交通环境下信号控制策略实施后反馈的结果,迭代优化路口的公交信号优先控制策略,从而使其具备了自学习的能力.基于Paramics的仿真实验表明,该算法能够在保障路口正常交通秩序的同时,显著提高公交车运行效率.
舒波,李大铭,赵新良
东北大学工商管理学院
摘 要:综合分析了影响城市公共交通系统运行的多种因素,提出了一种新型的基于强化学习算法的城市公交信号优先控制策略.该策略利用强化学习算法的试错-改进机制,根据不同交通环境下信号控制策略实施后反馈的结果,迭代优化路口的公交信号优先控制策略,从而使其具备了自学习的能力.基于Paramics的仿真实验表明,该算法能够在保障路口正常交通秩序的同时,显著提高公交车运行效率.
关键词:公交系统;交通信号控制;公交信号优先;强化学习;回报函数;