基于时序图规划的交通信号控制方法
刘淑华,程宇,李高权,尹禄
(东北师范大学 计算机科学与信息技术学院,吉林 长春,130117)
摘要:对智能规划中的时序图规划进行拓展研究,使其能处理动作执行期间动作效果实时变化的问题,并将其应用到与时序密切相关的交通信号控制领域。使用PDDL语言对信号灯系统建模,然后利用TGP规划器进行求解,将求解后的结果在GLD仿真系统中进行模拟并与其它算法进行对比。仿真结果证明提出的模型和算法的有效性。
关键词:时序图规划;PDDL语言;智能信号灯;GLD仿真系统
中图分类号:U491 文献标志码:A 文章编号:1672-7207(2011)S1-1048-05
Traffic light control based on temporal graph planning
LIU Shu-hua, CHENG Yu, LI Gao-quan, YIN Lu
(School of Computer Science and Information Technology, Northeast Normal University, Changchun 130117)
Abstract: Temporal graph planning (TGP) was extended and invited to deal with the real-time change of action effects during action executing, and then it was applied to intelligent traffic light system. The traffic light model was established in PDDL, and then the planning result based on the model was resolved by TGP. The planning result was simulated to control traffic lights in GLD simulation system and compared with other algorithms. The simulation results prove the efficiency of the model and algorithm.
Key words: temporal graph planning; PDDL; intelligent traffic light; GLD simulation system
交通与我们的生活息息相关,对国民经济的发展也具有非常重要的作用。然而,随着经济的迅速发 展,私家车数量迅猛增长,导致城市交通网络中拥挤阻塞问题日益严重,越来越引起人们的重视。城市交通是由大量道路和交叉口组成的网状结构,而设立在交叉口上的交通灯是解决不同方向交通流冲突的主要手段之一,因此,对交通信号进行有效的控制是十分必要的。发达国家从20世纪60年代开始进行智能交通领域的研究,并取得了不少有价值的成果[1-2]。国际上比较典型的城市交通信号控制系统包括英国的TRANSYT系统、SCOOT系统、澳大利亚的SCATS系统以及美国的RHODES系统等。我国在20世纪70年代末就已经开始在交通运输和管理中应用电子信息技术。在此后的20多年里,在政府的支持与坚持自主开发的基础上,通过广泛的国际交流与合作,在ITS领域进行了初步的理论研究、产品开发和示范应用,并取得了一定的成果。具有代表性的系统包括华通HT-UTCS系统和上海SUATS系统等。将先进的智能控制技术、信息融合技术、智能信息处理技术与交通工程结合起来,己成为一个崭新的研究方向[3]。
对信号控制参数的优化是交通信号控制研究的核心内容,随着人工智能技术的发展,一些人工智能的方法被应用到交通信号控制领域,如遗传算法[4]、强化学习[5]、多智能体技术[6]、模糊控制理论[7]和神经网络技术[8]等。近年来,智能规划问题是人工智能领域中的又一个研究热点,与传统的规划相比,它的规划速度快,因此,在自主机器人、航空航天、人机交互、数据挖掘等许多领域都得到了广泛的应用。由于现实世界的许多问题都与时间和资源有着密切的联系,所以在传统规划思想的基础上,又诞生了时序规划(Temporal Planning)[9]]和数值规划(Metric Planning)[10],使得智能规划能更好地描述和求解现实中的问题。
1 问题域
交通信号区域协调控制中各个交叉口的交通流如图1所示。包括东、南、西、北4个方向,每个方向均存在左行、直行和右行3个车道车流。本文主要研究的是区域内包含多交叉口、多信号灯的情况,如图2所示。
图1 单交叉口交通流分布
Fig.1 Traffic flow of intersection
图2 多交叉口区域交通网络
Fig.2 Traffic flow of multi intersections
对信号灯的控制分为点控、线控和面控。点控和线控已有很多较为成熟的算法,控制难度及计算复杂度都较低。与之相比,面控的计算复杂度会随着交叉口数目的增多而迅速增加,另外,不同方向信号灯之间的互斥关系也使得控制算法的难度加大。
由于图规划的速度快,而时序图规划又适合处理信号灯的持续性动作和描述交叉口内部各相位之间以及交叉口之间的冲突关系,因此,本文利用时序图规划的理论和方法实现交通信号的区域协调控制。首先根据时序图规划的描述需求,对区域交通信号控制系统进行建模,然后用信号灯仿真系统GLD模拟交通运行情况,将提出的算法在GLD环境中进行测试,最后对仿真结果进行对比分析。
2 系统建模
采用时序图规划求交通信号灯的最优解,首先要对信号灯系统进行建模。构成交通信号区域协调控制算法的元素包括交叉口(Intersection)、交通信号灯(Traffic Light)和指向交叉口方向的车道(Lane)。本文采用规划问题描述语言(PDDL, Planning domain definition languag)2.1版对交通信号的区域协调控制进行建模。
2.1 参数描述
表1、表2和表3分别列出交通信号的时序规划模型中所需的谓词、动作和数值资源。
表1 谓词列表
Table 1 Predication list
表2 动作列表
Table 2 Action list
表3 数值资源
Table 3 Numeric variable
2.2 动作模型的描述
基于上述谓词和数值的描述,用PDDL语言对交通信号灯的建模如下:
(define (domain Traffic_Control)
(: requirements :typing :fluents :durative-actions :duration-inequalities)
(: types
Intersection - object
TrafficLight - object
Lane—object
(: predicates
(isIn ?t - TrafficLight ?i - Intersection)
(control ?t - TrafficLight ?l - Lane)
(downstream ?la - Lane ?lb - Lane)
(free ?i - Intersection)
(success ?l - Lane)
)
(: functions
(length ?l - Lane)
(queue_length ?l - Lane)
(underway_num ?l - Lane)
(remain_time ?t - TrafficLight)
)
(: durative-action TURN_GREEN
:parameters (?i - Intersection ?t -
TrafficLight ?l_upstream - Lane ?l_downstream - Lane)
:duration (= ?duration 10)
:condition
(and
(at start (isIn ?t ?i))
(at start (control ?t ?l_upstream))
(at start (downstream ?l_upstream ?l_downstream))
(at start (free ?i))
(at end (< (queue_length ?l_upstream) 8))
)
:effect
(and
(at start (not (free ?i)))
(at start (increase (underway_num ?l_downstream) (queue_length ?l_upstream)))
(at end (free ?i))
(at end (success ?l_upstream))
)
)
(: durative-action underway
:parameters (?l - Lane)
:duration (= ?duration (length ?l))
:condition
(and
(at start (> (underway_num ?l) 0))
)
:effect
(and
(at end (increase (queue_length ?l) (underway_num ?l)))
)
)
); end define domain
将该描述定义为domain.pddl文件,供时序规划器进行调用。
2.3 地图信息的描述
地图由交叉口和道路组成,每个交叉口由多个不同方向的信号灯组成。图2所示的地图用PDDL语言描述的部分信息如下:
(define (problem two_intersections)
(: domain Traffic_Control)
(: objects
i1 i2 i3 i4 – Intersection
t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13 t14 t15 t16 t17 t18 t19 t20 - TrafficLight
l1 l2 l3 l4 l5 l6 l7 l8 l9 l10 l11 l12 l13 l14 l15 l16 l17 l18 l19 l20 l21 l22 l23 l24 - Lane
)
(: init
(isIn t15 i1)
(isIn t16 i1)
…
(control t15 l5)
(control t16 l6)
…
(downstream l5 l19)
(downstream l6 l19)
…
(free i1)
(free i2)
…
(= (queue_length l1) 0)
(= (queue_length l2) 0)
…
(= (underway_num l1) 10)
(= (underway_num l2) 10)
…
(= (length l1) 10)
(= (length l2) 10)
…
)
(: goal
(and
(success l7)
(success l8)
…
)
)
3 基于时序图规划的交通信号控制
策略
根据上述系统模型,时序规划器能规划出哪些交通灯变绿以及绿灯持续的时间,下一个规划周期的开始以上一周期最短的绿灯结束时间为准,这样,较为拥挤的道路在下一规划周期会获得绿灯通行权,因此这种控制策略是合理的。
4 系统仿真
为测试提出算法的可行性以及算法的性能,在交通信号灯仿真平台GLD上进行模拟测试。
4.1 仿真环境介绍
GLD仿真平台如图3所示。该仿真系统包括地图编辑器和运行模拟器2部分,地图编辑器用于生成新地图或修改原有地图,运行模拟器用于模拟实际的交通运行情况。该平台提供了一些交通信号控制算法,如随机法,爬山法,遗传算法和强化学习算法等。因此采用该平台不仅能验证提出的算法是否可行,而且容易比较不同算法的性能。
图3 GLD仿真平台
Fig.3 GLD simulation platform
仿真系统的后台是时序规划器CRIKEY,给定地图信息和交通模型后,CRIKEY就可以规划出哪些交通灯变绿以及绿灯持续的时间。
4.2 仿真算法的实现
GLD仿真系统与规划器CRIKEY之间要互相传递对方所需参数,以实现系统的连接。规划器CRIKEY从GLD平台中获得当前各个车道的长度、车辆等待队列的长度以及各个信号灯的状态,然后根据这些数据规划出下一个信号灯周期,哪些信号灯变绿以及绿灯持续的时间。这些规划结果用于控制GLD中的交通灯,从而实现对车流辆的控制,具体控制流程如图4所示。
图4 交通灯控制算法流程图
Fig.4 Flow chart of traffic light control
4.3 仿真结果
为验证该算法的性能,将它与其它算法进行对比,用new control代表本文提出的算法,选择系统中的2个较典型算法random和red light district算法进行对比,结果如图5所示。由图5可以看出:系统在到达相同用户数的前提下,本算法的平均等待时间与red light district算法差不多,并且远远小于random算法的等待时间,证明了该算法的有效性和实用性。
图5 用户数与平均等待时间关系
Fig.5 Relation of users and waiting time
5 结论与展望
(1) 对智能规划中的时序图规划进行拓展研究,使其能处理动作执行期间动作效果实时变化的问题。
(2) 将时序图规划应用到与时序密切相关的交通信号灯控制领域,实现利用实时规划结果控制交通信号的目的。
(3) 未来有待解决的问题包括进一步优化系统模型和建立支持动作执行期间动作效果连续可变的规划器。
参考文献:
[1] French R L. A comparison of IVHS progress in the United tates, Japan and Europe through 1993[R]. Washington D C: IVHS America, 1994: 525-530.
[2] French R L. A decade of global progress in intelligent transportation[C]// Proceedings of the 2nd World Congress on ITS. Yokohama, Japan: VERTIS, 1995: 1254-1259.
[3] 严新平, 吴超仲. 智能运输系统—原理. 方法及应用[M]. 武汉: 武汉理工大学出版社, 2006: 9-11.
YAN Xin-ping, WU Chao-zhong. Intelligent transportation systems—principles, methods and applications[M]. Wuhan: Wuhan University of Technology Press, 2006: 9-11.
[4] FOY M D, Benekohal R F, Goldberg D E. Signal timing determination using genetic algorithms. Transportation research[R]. Washington D C: National Research Council, 1992.
[5] ABDULHAI B, Pringle R, Karakoulas G J. Reinforcement learning for true adaptive traffic signal control[J]. ASCE Journal of Transportation Engineering, 2003, 129(3): 278-285.
[6] Burmeister B, Haddadi A, Matylis G. Application of multi-agent systems in traffic and transportation[C]// Software Engineering, IEEE Proceedings. 1997, 144(1): 51-60.
[7] Pappis C P, Mamdani E H. A fuzzy logic controller for a traffic junction[J] IEEE Transactions on Systems, Man, and Cybernetics, 1977(7): 707-717.
[8] LIU Zhi-yong, LI Shui-you. Artificial neural networks self-tuning predictive control for traffic signals[J]. Control Theory & Applications, 2003, 20(6): 933-937.
[9] Smith D, Weld D. Temporal planning with mutual exclusion reasoning[C]// Proc. of the 1999 International Joint Conference on Artificial Intelligence. San Francisco, US: Kaufmann Publishers Inc, 1999: 791-798.
[10] Jana Koehler. Planning under resource constraints[C]//European Conference on Artificial Intelligence, Brighton, UK: Wiley, 1998: 489-493.
(编辑 方京华)
收稿日期:2011-04-15;修回日期:2011-06-15
基金项目:吉林省科技厅高新处重点项目(20100305)
通信作者:刘淑华(1970-),女,内蒙古赤峰市人,博士,副教授,从事智能交通和移动机器人的研究;Tel: 0431-84536338; E-mail: liush129@nenu.edu.cn