中南大学学报(自然科学版)

一种改进的神经网络预测模型在铁路春运客流

预测中的应用

汪健雄,张军锋,王炜炜,吕晓艳

(中国铁道科学研究院 电子计算技术研究所,北京,100081)

摘 要:

度对铁路客运量数据进行分析,从而得出不同考察粒度下客流时间序列中的反应的时间特征,并基于以上特征和BP神经网络提出一种改进的神经网络模型,提供模型的建立过程和算法流程,最后通过在春运客流预测中的应用与传统BP网络模型进行对比。

关键词:

铁路客运量预测时间序列神经网络

中图分类号:U293.1          文献标志码:A         文章编号:1672-7207(2011)S1-1020-06

An improved neural network and its’ application in prediction of railway passenger volume during spring festival

WANG Jian-xiong, ZHANG Jun-feng, WANG Wei-wei, L? Xiao-yan

(Institute of Computing Technology, China Academy of Railway Science, Beijing 100081, China)

Abstract: The railway passenger volume was analyzed in different aggregation degrees to extract time feature from passenger volume time series, and an improved neural network model was produced through building model and showing algorithms, which was compared with traditional BP neural network by applying in prediction of railway passenger volume during spring festival.

Key words: railway passenger volume; prediction; time series; neural network

铁路春运的客流预测在铁路旅客运输组织工作中一直是一个重点,也是难点所在。长期以来,很多学者都采用神经网络和使用定量方法建立了时间序列预测模型[1-3]。但这些方法大多是将客流看作单一时间序列,而未对客流本身的内在规律进行研究。实际上,客流的变化应呈现出显著的趋势和周期等规律。根据观察,每日客流量变化和月总量变化既存在不同的规律,又同时相互影响。本文作者将铁路客运量数据分别将以日和月为单位聚合进行考察,提取出符合客运量规律的实际特征,提出一种新的基于BP神经网络的双层次正交神经网络,将其应用到铁路客运量预测领域,并通过2011年春运客流预测的实践检验证明,起到了较好的效果。

1  铁路客运数据分析

本研究以全铁路旅客的总发送量为例进行特征分析,收集了2003—2010年间的全路每日旅客发送量数据,同时按照月份重新聚合,形成3个时间序列,并提取时间特征进行定义,从中找出影响客流趋势变化的关键变量以进行建模。从连续8年的发送量数据中可以观察到其趋势性、周期性、季节性和不规则性4个主要特征[4]

1.1  客流特征提取

趋势特征反映多个连续周期中是否存在增长或下降趋势,式(1)用于表述趋势特征:

               (1)

式中:t为时间维度,取决于所使用的观察单元,通常为1天或1月;x0为时间原点的发送量;ξ反映增长或下降的趋势。

周期特征反映数据是否存在重复行为,式(2)用于描述周期特征:

      (2)

式中:τ表示周期的长度,在日数据中取τ=7,即以1周为单位考察每日特征,在月数据中取τ=12,即以1年为单位考察每月特征;x0为时间原点的发送量;ξ反映t时刻发送量相对于上一周期中同一时刻的增长或下降的趋势。

季节特征是随着自然季节或节假日出现的淡旺季转换特征,如春运、暑运、黄金周及各种小长假所表现的客流激增现象。总体上看,在季节特征中,节假日是最主要的影响因素,因为节日期间旅客需求提高到高位水平,但在节日结束后转换到正常水平。在我国,节假日情况复杂,小长假、黄金周较多,且春运、暑运持续时间长,为世界所罕见,本研究重点将春运、暑运作为中期旺季特征进行考察,并将小长假、黄金周作为短期旺季特征进行考察。由于不规则性是由难以预料的作用因素引起的,出现概率较低,暂不考虑其影响。

1.2  特征建模

从图1连续8年的日数据中,可以得到一条明显的趋势线,体现了趋势特征,其体现了稳中有升的一个上升趋势;图2取2010年中10个连续的星期来显示周内每日数据的特征,水平轴表示时间,垂直轴表示日运量与周运量的比率,体现了周期模式。同时从图1可以看出:旺季旅客需求增长,淡季又回归到正常水平,每当一个相对长的假日到来时则会出现1个波峰,而且这个规律随着时间的推移越来越明显。

通过聚合日数据得到月数据,选取8年96组数据进行分析,如图3所示。从月数据序列也可以得出1条明显的趋势线,且以当月区间内呈现近似M型的客流变化模式。从图3中叶可以看出:节假日仍然是客流增长的最大影响因素。

2  改进的BP神经网络预测模型

2.1  特征变量

通过从历史数据中提取特征变量,发现日数据中日趋势、日周期、春暑运和小长假是4个主要影响变量,月份数据中,月趋势和月周期是另外2个影响变量,而在日数据中则不存在月趋势和月周期,春运和暑运对月数据影响较大,而小长假对其影响则不显著。使用这些特征作为客流预测模型的输入变量,具体定义如表1所示。

表1各式中:DT为1年中每日旅客发送量变化趋势,万人;为观察1年中每日旅客发送量变化的初始日旅客发送量,万人;tD为观察1年中每日旅客发送量变化的持续天数,tD=1, 2, …, 365;DC为1周内每日旅客发送量周期性特征;为观察1周内旅客发送量日变化的初始日旅客发送量,万人;td为观察1周内旅客日发送量变化的持续天数,td=1, 2, …, 7;τd为日周期的长度,取7,即以1周为时间单元考察旅客日发送量变化的特征;MT为1年中旅客发送量月变化趋势,万人;为观察1年中旅客发送量月变化的初始月旅客发送量,万人;tM为观察1年中旅客发送量月变化的持续月数,tM=1, 2, …, 12;MC为观察1年中每月旅客发送量周期性特征,万人;tm为观察1年中考察旅客月发送量变化的持续月数,tm=1, 2, …, 12;τm为月周期的长度,取12,即以1年为时间单元考察旅客月发送量变化的特征。

图1  乘客日数据(2003-01-01—2010-12-31)

Fig.1  Volume of passenger everyday (2003-01-03—2010-12-31)

图2  乘客周数据(2010-06-01~2010-08-09)

Fig.2  Volume of passenger every week (2010-06-01~2010-08-09)

图3  乘客月数据(2003年1月~2010年12月)

Fig.3  Volume of passenger every month (2003-01~2010-12)

表1  输入变量及对应神经元数目表

Table 1  Input variants and number of neurons


2.2  改进的BP神经网络预测模型

BP神经网络是一种前向神经网络,它由输入层、输出层和若干个隐含层组成。输入层用于接受外部输入,隐含层数目由输入的特征决定。BP神经网络的学习算法的思想是:对于给定的学习样本, 使网络的输入等于样本的输入, 然后用网络的实际输出和学习样本输出之间的误差来修改权值, 使网络的输出与样本的输出尽可能接近, 也就是使网络输出层的误差平方和达到最小[5]。其数学表达式为

            (3)

式中:E为全局误差;dj为输出层的第j个节点的期望输出;表示l层的第j个节点的激活函数f的输入;表示l层的第j个节点的实际输出;M为神经网络的层数。

对于输出层应用最速下降法,反向调整各层连接权值,使误差最小。设为连接输出层节点和最后一个隐含层节点的连接权值,沿负梯度方向调整权值的修正量为

            (4)

其中:

          (5)

式中:为第l层的第i个节点的输出;

为连接l-1层的第i个节点与l层的第

j个节点的权值;η为学习速率。此时,隐含层权值的更新公式为

             (6)

其中:

          (7)

下列算法是描述BP神经网络学习过程:

Step 1:初始化网络结构;

Step 2:输入特征变量到输入层节点;

Step 3:计算隐含层节点的输出;

Step 4:输出层节点根据隐含层的计算输出层的结果;

Step 5:根据式(3)计算全局误差,若误差小于某一设定阈值,则训练截止;

Step 6:根据式(5)计算偏导数,用于调整输出层节点的权值;

Step 7:根据式(4)训练每个输出层节点的权值;

Step 8:对于每个隐含层节点,使用式(7)计算

Step 9:根据式(6)训练每个隐含层节点的权值,转向step 2;

Steps 2~4是信息的前向计算过程,Steps 5~9是误差的反向传播过程。本研究中,隐含层神经元的数目取输入层和输出层神经元数目的算数平均值,输出层产生预测信息并传播误差用于参数估计,输出层神经元的数目取决于预测主题的多少。根据表1,存在7种类型的输入,在输入层使用了15个神经元,且只产生一个输出,表示为,隐含层神经元数目取8,每个相邻层的连线具有一个权值,建立如图4所示的神经网络模型:

图4  改进的神经网络预测模型

Fig.4  Improved forecast model based on neuron network

由于旅客流量是动态更新的,在网络训练中应可使用滑动窗口学习方法,以保留最近的数据和排除距当前较远的数据[6]

3  春运客流预测应用分析

表2所示为使用该模型对2011期间铁路客运量数据进行预测的实际结果并与经典BP神经网络模型进行对比的情况。

从表2可以看到:采用新模型的平均预测误差比经典BP网络的数据更接近真实数据。同时,考察误差的变化速度,采用均方差(Mean square error, MSE)来考察该神经网络明显的误差变化情况。均方差的定义如方程(8)所示:

          (8)

式中:x(t)为实际输出;为预测输出;m为每月天数。

从图5可以看出:BP网络在50步以后达到期望的误差范围,改进后的神经网络仅在37步就达到了比BP网络更小的误差。通过实验还发现:使用距预测日期最近的日数据得到的模型,与距预测日期较远的日数据得到的模型输出有一定差别,因此,并非距离预测区间越近的训练数据得到的预测结果就准确。所以,需要进一步实验确定采样日期与预测日期的最佳间隔。

表2  改进的神经网络和BP网络的预测精度对比

Table 2  Comparison of forecast accuracy between improved forecast module based on neuron network and BP model

图5  改进的神经网络和BP网络的误差变化对比

Fig.5  Comparison of error between improved forecast module based on neuron network and BP model

4  结论

新模型在解决短期铁路客流预测问题时相对于经典BP网络模型具有更高的预测精度和更好的误差性能。但由于与经典方法[3]相比,它具有多种类型的特征输入,网络规模增大的同时也导致了神经网络隐含层节点增加,而隐含层节点的增加将导致连接数急剧增长;同时,由于BP神经网络在进行学习时,每个隐含层节点或权值都可能发生改变,而隐含层节点只能看见它自己的输入和输出节点回传给他的误差,节点的计算结果由于误差的不断变化而不断修正,从而导致隐含层需要较长的训练时间才能达到稳定结   构[7],且神经网络的泛化能力降低。

参考文献:

[1] 侯福均, 吴祈宗. BP 神经网络在铁路客运市场时间序列预测中的应用[J]. 运筹与管理, 2003, 12(4): 73-75.
HOU Fu-jun, WU Qi-zong. Application of BP neural network in the sequence prediction of the market of railway passenger traffic[J]. Operations Research and Management Science, 2003, 12(4): 73-75.

[2] 王卓, 王艳辉, 贾利民, 等. 改进的BP 神经网络在铁路客运量时间序列预测中的应用[J]. 中国铁道科学, 2005, 3(2): 127-131.
WAN Zhuo, WANG Yan-hui, JIA Li-min, et al. The application of improved BP neural network in the prediction of railway passenger volume time serial[J]. China Railway Science, 2005, 3(2): 127-131.

[3] 罗海燕, 盖宇仙. 应用改进BP网络进行铁路客运量预测研究[J]. 甘肃科学学报, 2008, 20(2): 103-106.
LUO Hai-yan, GAI Yu-xian. A predictive study on the improved BP neural network in railway passenger volume[J]. Journal of Gansu Science, 2008, 20(2): 103-106.

[4] 李工农,阮晓青,徐晨. 经济预测与决策及其Matlab实现[M]. 北京: 清华大学出版社, 2007.
LI Gong-nong, RUAN Xiao-qing, XU Chen. Forecasting and decrsion methods in economics[M]. Bejing: Tsinghua University Press, 2007.

[5] 蒋宗礼. 人工神经网络导论[M]. 高等教育出版社, 2001.
JIANG Zong-li. Artifical neural systems foundation, paradigms application and implement[M]. Beijing: Higher Education Press, 2001.

[6] Morantz B H, Whalen T, Zhang G P. A weighted window approach to neural network time series forecasting. Zhang G P, Ed. Neural networks in business forecasting. USA: IRM Press.

[7] Fahlman S E, Lebiere C. The cascade-correlation learning architecture, advances in neural information processing[M]. San Francisco: Morgan Kanfmann Publishers, 1990: 524-532.

(编辑 李艳红)

收稿日期:2011-04-15;修回日期:2011-06-15

基金项目:铁道部科技研究开发计划项目(2000X056-A)

通信作者:汪健雄(1979-),男,安徽无为人,博士,助理研究员,从事信息系统研究;电话:010-51849120; E-mail: wjx304@163.com

摘要:按照不同的聚合度对铁路客运量数据进行分析,从而得出不同考察粒度下客流时间序列中的反应的时间特征,并基于以上特征和BP神经网络提出一种改进的神经网络模型,提供模型的建立过程和算法流程,最后通过在春运客流预测中的应用与传统BP网络模型进行对比。

[1] 侯福均, 吴祈宗. BP 神经网络在铁路客运市场时间序列预测中的应用[J]. 运筹与管理, 2003, 12(4): 73-75. HOU Fu-jun, WU Qi-zong. Application of BP neural network in the sequence prediction of the market of railway passenger traffic[J]. Operations Research and Management Science, 2003, 12(4): 73-75.

[2] 王卓, 王艳辉, 贾利民, 等. 改进的BP 神经网络在铁路客运量时间序列预测中的应用[J]. 中国铁道科学, 2005, 3(2): 127-131. WAN Zhuo, WANG Yan-hui, JIA Li-min, et al. The application of improved BP neural network in the prediction of railway passenger volume time serial[J]. China Railway Science, 2005, 3(2): 127-131.

[3] 罗海燕, 盖宇仙. 应用改进BP网络进行铁路客运量预测研究[J]. 甘肃科学学报, 2008, 20(2): 103-106. LUO Hai-yan, GAI Yu-xian. A predictive study on the improved BP neural network in railway passenger volume[J]. Journal of Gansu Science, 2008, 20(2): 103-106.

[4] 李工农,阮晓青,徐晨. 经济预测与决策及其Matlab实现[M]. 北京: 清华大学出版社, 2007.LI Gong-nong, RUAN Xiao-qing, XU Chen. Forecasting and decrsion methods in economics[M]. Bejing: Tsinghua University Press, 2007.

[5] 蒋宗礼. 人工神经网络导论[M]. 高等教育出版社, 2001.JIANG Zong-li. Artifical neural systems foundation, paradigms application and implement[M]. Beijing: Higher Education Press, 2001.

[6] Morantz B H, Whalen T, Zhang G P. A weighted window approach to neural network time series forecasting. Zhang G P, Ed. Neural networks in business forecasting. USA: IRM Press.

[7] Fahlman S E, Lebiere C. The cascade-correlation learning architecture, advances in neural information processing[M]. San Francisco: Morgan Kanfmann Publishers, 1990: 524-532.