i+1, 0
式中:x∈[0, 1],是方向函数F1(x)的独立变量;xi∈[0, 1],是从轨迹起点到轨迹上任一点Pi的累积长度与轨迹整体长度的比例,即轨迹段{P1, , Pi}与轨迹整体{P1, , Pm}的长度之比;△xi为相邻轨迹点Pi+1和Pi累计长度比例差异;△hi为相邻轨迹点Pi+1和Pi的行驶方向角。由式(6)可知,“距离-方向”函数是分段线性函数,如图4所示。
图4 轨迹的“距离-方向”函数
Fig. 4 “Distance-direction” function of trajectories
给定变量x∈[0, 1],轨迹T1和T2的“距离-方向”函数分别描述为F1(x)和F2(x),进而轨迹T1和T2的方向相似性计算式为
(7)
式中:xi和xj分别为轨迹点Pi∈T1 和Pj∈T2的累积长度比率;m和n分别为T1和T2的轨迹点个数;△F(x)为F1(x)和F2(x)的归一化差值,
(8)
基于轨迹的几何相似性和方向相似性,轨迹之间的总体相似性则可定义为sim(T1, T2)=simlcst(T1, T2)× 0.5+simori(T1, T2)×0.5。则轨迹之间的距离矩阵可以定义为D=(dij)N×N(其中,dij=1-sim(Ti, Tj))。
2.1.3 交叉口转向模式聚类
由于同种转向模式轨迹之间存在较大相似性,因而,可利用轨迹层次聚类[21]的方法,对交叉口内轨迹Tint进行聚类,用于探测交叉口内的转向模式。在层次聚类过程中,利用“凝聚法”自底向上进行聚类,直到所有轨迹合并为1个簇为止。同时,利用Davies-Bouldin指标[22]对聚类结果有效性进行评价(即DB指标),识别合理的转向模式个数。本文将聚类个数设置为n1~n2(实验中设置为2~40),选择DB指数最小时对应的聚类个数K为最佳聚类结果。通过分析DB指标可以发现,有效的聚类簇内部应足够紧密,且簇与簇之间具有较大分离性,可通过计算簇的紧密性和分离性比率对聚类结果进行评价。因此,DB指标越小,聚类有效性越强。
2.2 路段轨迹分类
在出入口识别的基础上,轨迹被划分为交叉口内轨迹Tint和路段轨迹Tout,其中,可从Tout中提取路段的几何、拓扑结构信息。通过分析交叉口连通性对路段进行几何、拓扑精细建模。
Tout可划分为2类:包含1个候选出入口点的轨迹和包含多个候选出入口点的轨迹。交叉口及其拓扑连接矩阵示意图如图5所示(其中,0表示无连接,1表示存在连接)。由图5可知包含1个侯选出入口的轨迹所在的路段为悬挂路段,由于候选出入口点信息包含所属交叉口编号,因此,构造交叉口之间的拓扑连接矩阵D,根据交叉口的拓扑连通性对路段轨迹进行分类。如图5所示,矩阵内元素D(i×j)为交叉口之间的同一类连接模式,即交叉口i与j之间有轨迹连接。由于存在单向通行道路的存在,因此,矩阵D是非对称矩阵,若存在交叉口3到5的轨迹,而5到3的轨迹不存在,则所提方法具有提取车道级道路网的能力。
图5 交叉口及其拓扑连接矩阵示意图
Fig. 5 Intersections and topological connection matrix
根据交叉口之间的拓扑连接矩阵D(N×N),可对轨迹进行分类。首先,根据D(N×N)筛选出属于同种连接模式D(i×j)的路段轨迹Tout(i, j);然后,利用2.1.3节所提轨迹聚类方法对Tout(i, j)进行聚类。由于受道路交叉口探测精度影响,若干道路交叉口未被探测,本文对Tout(i, j)进行聚类可识别不同连接路径,从而考虑交叉口探测精度的影响。2条交叉口之间轨迹Tout(i,j)的不同连接模式如图6所示,其中,实线为交叉口的不同连接路径,本文方法能够对其有效识别。
图6 2个交叉口之间轨迹Tout(i,j)的不同连接模式
Fig. 6 Different connection modes of track Tout(i,j) between intersection i and j
对于悬挂路段(图6中虚线),其特点在于只含1个候选出入口点,因此,分别提取每个交叉口的悬挂轨迹数据Tout(i),根据2.1.3节轨迹聚类方法对Tout(i)进行聚类。在上述基于交叉口连通性分析和悬挂轨迹分类的基础上,可对研究区域路段轨迹Tout进行有效分类,进而对每一类轨迹的中心线进行提取,获得城市道路网的精细几何和拓扑结构。
2.3 道路网几何、拓扑结构精细建模
在对Tint和Tout进行聚类、分类的基础上,令CL(i)为Tint或Tout的轨迹簇,采用K段主曲线算法[23]提取CL(i)的中心线即车道线,进而生成道路网,记为RD。
K段主曲线由VERBEEK等提出[24],采用局部主成分分析的方法来计算第K条线段,依据光滑性连接形成主曲线,如图7所示。K段主曲线的算法步骤主要由以下几步组成。
图7 利用K段主曲线提取车道线
Fig. 7 Extracting lane lines using K-segment principal curve
Step 1:初始化。输入轨迹点数据P=(P1, P2, , Pn),计算第1主成分,并取3σ为初始的线段长度,其中σ是第1主成分的标准差,得到初始线段l1和其Voronoi区域V1。
Step 2:插入新线段。若k≤kmax,则计算Pi并满足:
(9)
式中:dist(Ps)=min d(Ps,lj),为Ps与线段lj之间的最小距离;dist(Ps,Pj)=||Ps-Pj||2,为Ps与Pj之间距离的平方;j∈1~k。计算点Pi的Voronoi区域Vq并取Vq的第1主成分线,以3σ作为新增线段lk的长度并记录其Voronoi区域Vk。
Step 3:调整。若新增线段后,所有线段旧的Voronoi区域{V1,V2,…,Vk}与新的Voronoi区域{V1′, V2′,…,Vk′}不同,则将新的Voronoi区域赋给旧的Voronoi区域,并重复Step 2,直到Voronoi区域不变为止。
Step 4:优化。将k条线段构造成哈密顿回路,并利用城市旅行商问题(TSP)进行优化形成哈密顿回路。
3 基于车辆轨迹和签到文本的道路网语义信息建模
3.1 交叉口转向规则语义提取
交叉口内轨迹簇的转向规则可通过挖掘每条轨迹的转向规则得到。交叉口转向规则判别如图8所示。
图8 交叉口转向规则判别
Fig. 8 Intersection turning rules inference
设P1为轨迹起始点,Pm为该轨迹终点,θ1和θ2分别为P1和Pm的行驶方向角,Pi为轨迹上任一点,则该轨迹的转向规则如下:
1) 若θ1-θ2 ≈ ±180°,则转向规则为“掉头”;
2) 若(1<i<m)为正,则转向规则为“右转”;
3) 若(1<i<m)为负,则转向规则为“左转”;
4) 若(1<i<m)为零向量,则转向规则为“直行”。
通过上述分析可得到轨迹簇内每条轨迹的转向规则:当簇内超过50%以上轨迹判定为某一特定转向规则时,则该转向规则定义为轨迹簇的转向规则;当交叉口内未发现某个转向规则的轨迹簇时,则认为该转向规则在交叉口内是禁止的。
3.2 道路名称提取
地图POI和微博签到文本中包含大量与道路相关的信息,如道路名称等。本文利用高德地图POI和新浪微博签到文本数据,基于Jiaba分词技术(https://github.com/fxsjy/jiebademo),从这些位置文本的地址字段中将道路名称划分出来。如对于POI地址“湖北省武汉市江汉路527号,武汉美术馆对面”,利用Jieba中文分词之后的结果为:“湖北省/武汉市/江汉路/527/号/,/武汉/美术馆/对面”。进而,提取出含有“路”“大道”“ 街道”和“街”关键词的词语。
由于POI数量众多,密度空间分布差异大,可将POI与道路网进行匹配,以50 m为缓冲区,提取道路路段的缓冲区内的POI数据,如图9所示。然后,基于Jieba分词技术提取其缓冲区内POI所含道路名称,生成道路名称频度直方图,并选取频度最大的道路名称为该路段道路名称。从图9可见:示例路段的名称可以描述为“丁字桥路”。
3.3 道路网平均速度提取
将所提取道路网按100 m进行重采样(即速度信息识别的空间分辨率设置为100 m),记为RD={e1, e2, , em},并将GPS轨迹点与所建模的道路网进行匹配。于是,道路网RD的每条边ei都有若干GPS点(记为Pei={P1, P2, , Pni})与之匹配,这些GPS点的时间和速度信息可用于提取道路网的速度信息。将Pei划分为24个时段,统计路段ei在24个时段内平均速度信息,从而获得整个路网RD在24个时段内的速度信息。
4 实验结果与分析
4.1 实验数据
为验证本文方法的有效性,选取武汉市武昌区一块靠近长江南岸、面积约13 km×11 km的区域作为实验区域。该研究区域为武汉市人口、经济、商业较集中的区域,包含武昌火车站等交通枢纽和洪山广场等商业中心,并包含复杂道路网结构。如研究区域内包含了十字路口、T型路口、Y型路口、立交桥、环形路口等各种形态各异、结构复杂的道路交叉口。此外,在武昌火车站附近,道路网密度高,交叉口密集,适合验证本文所提方法在处理复杂路网、密集路网的有效性。选取2014年5月1日的浮动车GPS轨迹数据,包含1 129 466个轨迹点,经重采样和预处理后,含60 045条轨迹线。
图9 利用缓冲区内POI进行道路段名称提取
Fig. 9 Road name extraction using POI in buffer for
4.2 道路交叉口位置和范围探测
利用热点分析和聚类方法对交叉口的位置和范围进行探测,结果如图10所示。
图10 研究区域交叉口探测结果
Fig. 10 Results of intersection detection of study area
从图10可见:转向角热点主要分布于交叉口区域,表明热点分析的有效性;此外,研究区域包含大量复杂类型的道路交叉口,空间分布密度不一、形态各异、大小和范围差异巨大,采用本文方法较好地探测了道路交叉口的位置和范围。为了对道路交叉口探测结果进行定量评价,采用本文方法与文献[24]中方法分别计算交叉口探测结果的精度P、召回率R和F,表达式为:
(10)
式中:tp为正确探测交叉口数量;fp为错误探测交叉口数量;fn为未探测交叉口数量。通过与百度地图、高德地图进行人工判别,经统计发现本文所提方法共识别道路交叉口157个,正确识别136个,错误识别21个,未识别26个。由式(10)可知:本文方法交叉口探测精度P、召回率R和F分别为86.6%,84.0%和85.3%;文献[24]所提方法共识别道路交叉口186个,正确识别138个,错误识别48个,未识别24个,因而,交叉口探测精度P、召回率R和F分别为74.2%,85.2%和79.3%。图11所示为本文方法和文献中[24]中方法所提路网与遥感影像的叠加对比结果。从图11可以发现:本文方法提取的道路骨架与影像中道路更加吻合,包含更少误提取的悬挂路段;同时,本文方法计算的交叉口探测精度P以及F明显比文献[24]中方法的效果好。从图11(b)可以发现本文方法可以有效地提取精细的复杂道路交叉口。
图11 本文方法与文献[24]中方法提取路网与遥感影像比较
Fig. 11 Comparison between remote sensing image and road network extracted by methods in the paper and Ref. [24]
4.3 道路网几何拓扑、语义精细建模结果
道路网精细几何拓扑结构、道路名称信息和速度信息的建模结果如图12所示。
图12 道路网精细建模结果
Fig. 12 Fine road network modeling results
从图12可见:所生成的道路网具有名称、方向、速度等信息,在路段上包含2条车道线,也体现了本文方法在道路网精细建模方面的优势。其中,图12(b)所示为立交桥区域模拟结果,由于高程差异导致立交桥几何结构复杂,本文成功地对其进行了精细建模;图12(b)和(c)所示为较复杂道路交叉口模拟结果,其中,图12(b)左上角所示为包含高架式立交桥模拟结果,图12(c)所示为环形路口模拟结果。图12(d)~(f)所示分别为十字路口、“T”型路口、“Y”型路口较常见道路交叉口。可见,研究区域包含的道路交叉口形态各异、结构复杂,所提方法对研究区域道路网实现了精细建模,在路段和交叉口几何拓扑结构上,具有精细车道线;在语义信息方面,提取了道路网名称、速度等信息。
为了验证本文方法道路名称提取结果的有效性,通过对高德地图、百度地图进行人工判断,共识别含名称的道路237个,其中正确识别的道路名称为229个,错误识别的道路名称为8个,未识别的道路名称有8个,因而,道路名称识别的精度P、召回率R和F分别为97.0%,96.6%和96.8%,表明本文方法在复杂城市场景下道路网几何、拓扑、语义精细建模方面的有效性。
将所建模道路网的平均速度信息划分为24个时段,统计道路网24个时段内的平均速度,并划分到[0,5),[5,10),[10,15)和[15,+∞)共4个区间内,分析其时空特征。图13所示为其中4个主要时刻道路网平均速度的空间分布情况。从图13可见:道路网平均速度的空间分布在一定程度上表征了道路拥堵的时空分布特征。
图13 道路网若干典型时段内平均速度信息
Fig. 13 Road network average speed information of several typical time
本实验中采用2014年5月1日的车辆GPS轨迹数据对道路网平均速度进行演化分析,可以发现:1) 9:00—12:00,武昌火车站附近具有明显的拥堵现象,这可能由于“五一节”旅游人数增多,导致上午在武昌火车站附近呈现明显的车流高峰,并且一直持续到12:00;2) 在24个时段内,研究区域下方的立交桥附近较少出现车辆行驶缓慢的现象,表明该区域无拥堵出现;3) 武珞路作为武汉市较繁华的路段,从8:00—16:00都具有明显的车辆行驶缓慢现象,而16:00后车行缓慢现象减轻;4) 雄楚大道与岭南路交叉口处,在9:00—12:00易发生拥堵,交通缓慢,此外,在20:00—23:00容易发生拥堵,表明该交叉口具有重要的交通地位。整体上看,10:00—12:00的拥堵情况最严重,这种拥堵现象可能与“五一节”假期出行高峰有关,16:00—22:00则易出现局部车行缓慢现象。
5 结论
1) 道路网精细几何、拓扑、语义信息是实现智能交通、导航及行车规划的前提。泛在位置数据由于具有动态、实时的特性,为道路网精细信息的实时获取提供了新的数据源。
2) 本文提出一种城市道路网几何、拓扑、语义信息一体化精细建模方法。利用武汉市车辆轨迹数据进行实验分析,验证了本文方法的有效性。所提方法可以满足快速实时道路网几何、拓扑、语义信息精细获取需要,为智慧城市建设、智能交通系统提供支持。
参考文献:
[1] 傅仲良, 吴建华. 多比例尺空间数据库更新技术研究[J]. 武汉大学学报(信息科学版), 2007, 32(12): 1115-1118.
FU Zhongliang, WU Jianhua. Update technologies for multi-scale spatial database[J]. Geomatics and Information Science of Wuhan University, 2007, 32(12): 1115-1118.
[2] CHEN Chen, CHENG Yinhang. Roads digital map generation with multi-track GPS data[C]//2008 International Workshop on Education Technology and Training & 2008 International Workshop on Geoscience and Remote Sensing. New York, USA: IEEE, 2008: 508-511.
[3] DAVIES J J, BERESFORD A R, HOPPER A. Scalable, distributed, real-time map generation[J]. IEEE Pervasive Computing, 2006, 5(4): 47-54.
[4] 蒋益娟, 李响, 李小杰, 等. 利用车辆轨迹数据提取道路网络的几何特征与精度分析[J]. 地球信息科学学报, 2012, 14(2): 165-170.
JIANG Yijuan, LI Xiang, LI Xiaojie, et al. Geometrical characteristics extraction and accuracy analysis of road network based on vehicle trajectory data[J]. Journal of Geo-Information Science, 2012, 14(2): 165-170.
[5] 唐炉亮, 刘章, 杨雪, 等. 符合认知规律的时空轨迹融合与路网生成方法[J]. 测绘学报, 2015, 44(11): 1271-1276.TANG Luliang, LIU Zhang, YANG Xue, et al. A method of spatio-temporal trajectory fusion and road network generation based on cognitive law[J]. Acta Geodaetica et Cartographica Sinica, 2015, 44(11): 1271-1276.
[6] WANG Jing, RUI Xiaoping, SONG Xianfeng, et al. A novel approach for generating routable road maps from vehicle GPS traces[J]. International Journal of Geographical Information Science, 2015, 29(1): 69-91.
[7] BIAGIONI J, ERIKSSON J. Map inference in the face of noise and disparity[C]//Proceedings of the 20th International Conference on Advances in Geographic Information Systems: SIGSPATIAL '12. Redondo Beach, California. New York: ACM Press, 2012: 79-88.
[8] ZHANG Lijuan, THIEMANN F, SESTER M. Integration of GPS traces with road map[C]//Proceedings of the Second International Workshop on Computational Transportation Science: IWCTS '10. San Jose, California, New York: ACM Press, 2010: 17-22.
[9] KARAGIORGOU S, PFOSER D. On vehicle tracking data-based road network generation[C]//Proceedings of the 20th International Conference on Advances in Geographic Information Systems: SIGSPATIAL '12.Redondo Beach, California, New York: ACM Press, 2012: 89-98.
[10] EDELKAMP S, SCHRDL S. Route planning and map inference with global positioning traces[M]. Heidelberg, Berlin: Springer, 2003: 128-151.
[11] 唐炉亮, 阚子涵, 黄方贞, 等. 利用低频时空GPS轨迹进行交叉口通行时间探测[J]. 武汉大学学报(信息科学版), 2016, 41(1): 136-142.
TANG Luliang, KAN Zihan, HUANG Fangzhen, et al. Travel time detection at intersections from taxis' trace data[J]. Geomatics and Information Science of Wuhan University, 2016, 41(1): 136-142.
[12] WINDEN K V, BILJECKI F, SPEK S V D. Automatic update of road attributes by mining GPS tracks[J]. Transactions in GIS, 2016, 20(5): 664-683.
[13] 郭雪婷, 秦艳丽, 雷震. 基于出租车GPS数据的城市道路拥堵判别[J]. 交通信息与安全, 2013, 31(5): 140-144.
GUO Xueting, QIN Yanli, LEI Zhen. Urban road congestion discrimination based on taxi GPS data[J]. Journal of Transport Information and Safety, 2013, 31(5): 140-144.
[14] 张志平, 汪向杰, 林航飞. 基于浮动车数据的高速公路拥堵检测方法[J]. 交通信息与安全, 2012, 30(6): 95-99.
ZHANG Zhiping, WANG Xiangjie, LIN Hangfei. A detection method of expressway traffic congestion with probe car data[J]. Journal of Transport Information and Safety, 2012, 30(6): 95-99.
[15] WANG Yuqi, CAO Jiannong, LI Wengen, et al. Exploring traffic congestion correlation from multiple data sources[J]. Pervasive and Mobile Computing, 2017, 41: 470-483.
[16] VAN WINDEN K, BILJECKI F, VAN DER SPEK S. Automatic update of road attributes by mining GPS tracks[J]. Transactions in GIS, 2016, 20(5): 664-683.
[17] ZHENG Kai, ZHENG Yu, XIE Xing, et al. Reducing uncertainty of low-sampling-rate trajectories[C]//Proceedings of the 28th International Conference on Data Engineering. Washington: IEEE, 2012: 1144-1155.
[18] ORD J K, GETIS A. Local spatial autocorrelation statistics: distributional issues and an application[J]. Geographical Analysis, 2010, 27(4): 286-306.
[19] DENG Min, LIU Qiliang, CHENG Tao, et al. An adaptive spatial clustering algorithm based on delaunay triangulation[J]. Computers, Environment and Urban Systems, 2011, 35(4): 320-332.
[20] WANG Jing, WANG Chaoliang, SONG Xianfeng, et al. Automatic intersection and traffic rule detection by mining motor-vehicle GPS trajectories[J]. Computers, Environment and Urban Systems, 2017, 64: 19-29.
[21] MULLNER D. Modern hierarchical, agglomerative clustering algorithms[J]. IEEE Transactions on Analysis and Machine Intelligence, 1979, PAMI-1(2): 224-227.
[22] DAVIES D L, BOULDIN D W. A cluster separation measure[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1979(2): 224-227.
[23] VERBEEK J J, VLASSIS N, KRSE B. A k-segments algorithm for finding principal curves[J]. Pattern Recognition Letters, 2002, 23(8): 1009-1017.
[24] AHMED M, WENK C. Constructing street networks from GPS trajectories[C]//Algorithms-ESA 2012. Berlin, Heidelberg: Springer, 2012: 60-71.
(编辑 陈灿华)
收稿日期: 2018 -11 -19; 修回日期: 2019 -03 -02
基金项目(Foundation item):博通智慧城市研究院合作研发项目(BTZH2018002); 国家自然科学基金资助项目(41771452); 国家重点研发计划项目(2017YFB0503500);中南大学研究生科研创新项目(2018zzts708)(Project(BTZH2018002) supported by the Cooperative Research and Development Program of Botong Smart City Research Institute; Project(41771452) supported by the National Natural Science Foundation of China; Project(2017YFB0503500) supported by the National Key Research and Development Program of China; Project(2018zzts708) supported by the Graduate Research Innovation Program of Central South University)
通信作者:黄金彩,博士,从事时空数据挖掘研究;E-mail: huangjincaicsu@163.com