应用CF和Logistic回归模型编制滑坡危险性区划图
王卫东1, 2,陈燕平1,钟 晟1
(1. 中南大学 商学院,湖南 长沙,410083;
2. 中南大学 土木建筑学院,湖南 长沙,410075)
摘 要:根据地理信息系统(GIS),以滑坡发生确定性系数(CF)和Logistic回归模型编制贵州省滑坡灾害区划图,其主要步骤为:应用历史滑坡灾点面积和滑坡致灾单因子子集面积计算CF,由此确定主要的滑坡致灾因子;应用Logistic回归模型、地理信息系统(GIS)空间分析工具和统计软件SPSS寻求最合适的模型描述灾害是否发生(因变量)与致灾因子(自变量)之间的关系;计算研究区域内各单元的滑坡概率,划分危险性等级,绘制基于GIS的贵州省滑坡灾害区划图;最后,用历史灾害分布数据检验滑坡灾害区划图。研究结果表明:根据区划图,贵州省可分为4个区域,即低危险区、中等危险区、高危险区和极高危险区;对贵州省的危险性分区合理,结合CF与Logistic回归模型编制滑坡灾害区划图的方法有效。
关键词:滑坡;危险性区划;确定性因素;Logistic回归模型;地理信息系统
中图分类号:P642.22 文献标识码:A 文章编号:1672-7207(2009)04-1127-06
Landslides susceptibility mapped with CF and
Logistic regression model
WANG Wei-dong1, 2, CHEN Yan-ping1, ZHONG Sheng1
(1. School of Business, Central South University, Changsha 410083, China;
2. School of Civil and Architectural Engineering, Central South University, Changsha 410075, China)
Abstract: The landslides susceptibility mapped in Guizhou Province was established through integrating a certainty factor (CF) and the Logistic regression model based on geology information system (GIS). The procedures were as follows: Firstly, the key factors were selected according to CF deduced from the area of landslides inventory and the area of factors subclasses. Secondly, the most appropriate model was selected to describe the relationship between hazards (dependents) and the key factors (independents) using the Logistic regression model, GIS spatial analysis tools and SPSS. Thirdly, the landslide probability was calculated, the dangerous levels were divided and landslides susceptibility map was established. Finally, the susceptibility map was verified by the distribution of landslide inventory. The results show that according to susceptibility map, the study area can be classified into four categories of landslide susceptibility, i.e., low dangerous zone, moderate dangerous zone, high dangerous zone and very high dangerous zone. The method of integrating the CF and the Logistic regression model is an effective way to evaluate the landslide susceptibility.
Key words: landslide; dangerous zone; certainty factor; Logistic regression model; geology information system
滑坡是世界范围内发生最多的地质灾害之一。根据中国国土资源部资料[1],2007年,全国各类地质灾害共造成679人死亡和失踪,直接经济损失达24.75亿元。在中国西部的贵州省,2007年,滑坡导致大量基础设施被破坏,150多人丧生。基于地理信息系统(GIS)的滑坡灾害区划图是历史和潜在滑坡风险的有效评估工具,可用于土地利用和基础设施规划以及发展早期预警系统[2]。地理信息系统具有强大的地理信息存储、处理、分析和展示功能,正成为地质灾害分析和风险控制的一个主要平台。作为基本的分析工具,整合了很多分析模块的地理信息系统能有效地管理和操作不同规模(某个局部区域或全国范围)的滑坡灾害空间数据。在过去20年中,大量的地理学家和工程技术人员运用GIS识别滑坡,绘制滑坡灾害区划图。为评价滑坡危险性,采用了多种方法,概括为:概率与统计模型[3-6](如Logistic回归模型[5]和确定性系数(CF)多元回归模 型[6]),数学模型[7-8](如人工神经网络模型),确定性模型(安全系数法[9-10]),经验方法(权重线性组合模型(WLC)[11-13])等。在此,本文作者基于GIS和SPSS,采用确定性系数(CF)和Logistic回归模型相结合的方法编制贵州省滑坡灾害危险性区划图。用CF提取滑坡的关键致灾因子,将这些因子导入SPSS统计工具,得出Logistic回归模型的各项系数,应用回归模型计算研究区域内滑坡概率,并在ArcGIS下绘制滑坡危险度分区图。
1 滑坡致灾因子
1.1 滑坡致灾因子及其分类
贵州省位于北纬103?36′~109?35′,东经24?37′~ 29?13′,占地面积为176 167 km2。根据调查,贵州省潜在的滑坡致灾因子有高程、岩性、坡度、坡向、地形地貌、河流切割、地质构造等,滑坡的诱发因子主要是降雨和人类改造自然的活动(如公路、铁路的边坡开挖)。由于各致灾因子在不同等级(见表1)下对滑坡的影响程度不同,因此,有必要将各致灾因子进一步细化等级。据GIS,部分致灾因子及其再分类如图1~4所示。其中:
表1 因子子集的KCF和因子z
Table 1 Subclasses’ KCF and factors’ z
图1 岩性分组
Fig.1 Groups of slide-prone lithological
图2 与构造线的距离分级
Fig.2 Grades of proximity to structural line
图3 地形起伏分级
Fig.3 Grades of topography
图4 与公路的距离分级
Fig.4 Grades of proximity to drainage
图1所示是根据岩性对滑坡的影响程度划分的岩组等级、即稳定岩组、偶滑岩组、较易滑岩组和易滑岩组。
图2所示为滑坡和区域地质构造之间的关系。在ArcMap环境中,按与地质构造线距离取20级缓冲,每级1 km。然后,统计每级缓冲距离内的历史滑坡灾点数,最后,将20级灾点数量进行归类与分析,确定灾害点与构造线的距离关系可分为3级,即0~6 km,6~16 km和大于16 km。
图3所示是按地形起伏情况将研究区域划分的等级,共分为4级,即大起伏山地、中起伏山地、小起伏山地和平原地区。
图4所示为滑坡和公路之间的关系。在ArcMap环境中,按与公路距离取20级的缓冲,每级1 km。再统计每级缓冲距离内的历史滑坡灾点数。最后,将20级的灾点数进行归类与分析,确定灾害点与公路的距离关系可分为3级,即:0~9 km,9~15 km和大于15 km。
图5所示为贵州省历史滑坡分布图,根据国土资源部资料与国家地理信息系统绘制。
图5 历史滑坡分布
Fig.5 Distributions of landslides inventory
1.2 滑坡关键因子的选取
确定性系数(CF)是一个概率函数[14],其表达式为:
据GIS,首先将致灾因子划分为不同的因子子集(见表1),然后,将每个因子图层(图1~4)与历史滑坡图层(图5)进行叠加,统计每一子集面积和子集中所包含的滑坡面积,根据式(1)计算每一子集的KCF。每个因子子集的KCF比较分散,需要1个统一值以决定该因子的重要程度,即确定滑坡发生的关键因子。因此,将各子集的KCF进行合并,即
使用式(2)时,1次仅能合并2个KCF。本文从最小值开始,依次合并[14],得出z。根据z确定每一种致灾因子对滑坡的影响程度,进而确定滑坡发生的关键因子。
首先考虑10个致灾因子,分别为高程、年均降雨量、岩性、地形地貌、与河流的距离、与构造线的距离、与铁路的距离、与公路的距离、坡度和坡向。各因子子集的KCF和因子z的计算结果如表1所示。
KCF和z越大,表明对应的因子致灾的权重就越大。从表1可以看出,高程、年均降雨量和坡向的z出现了负数,经分析认为这3个因子对滑坡的影响不大,可以不考虑。岩性、与河流的距离、坡度、与构造线的距离、与公路的距离、与铁路的距离、地形地貌这7个因子的z大于0,可以认为它们与滑坡的相关性较大,是滑坡危险性评价中需要考虑的滑坡致灾因子。
需要说明的是,雨量是滑坡灾害的重要诱发因子,一般在滑坡预警预报中考虑的是预报当日之前1周的有效雨量(或累计雨量)和当天预报雨量。而本文在编制的滑坡危险性区划图过程中,年均降雨量对滑坡的分布没有显著影响(见表1)。
2 Logistic回归模型及其在滑坡中的应用
所谓Logistic回归,是指应变量为二值(二项)分类变量的回归分析。在地质灾害和灾情分析中,将各致灾因子作为自变量,灾害的发生与否作为因变量(其中,0代表灾害不发生,1代表灾害发生)[15]。
设P为灾害发生的概率,取值范围为[0, 1];1-P为灾害不发生的概率。将P/(1-P)取自然对数(ln(P/(1-P)),即对P进行Logit转换,记为Logit P,则Logit P的取值范围为(-∞, +∞)。以灾害发生的概率P为因变量,建立回归方程:
令
, (4)
则
Logistic回归模型是普通多元线性回归模型的推广,它的误差项服从二项分布而非正态分布,模型中B0为常数,表示在不接触任何潜在危险或保护因素条件下,效应指标发生与不发生事件的概率之比的对数。
在式(3)和式(5)中,若逻辑回归系数B1, B2, …, Bn被确定,则根据不同的指标Iij,可计算某一区域发生灾害的概率P。根据P,可以划分灾害发生可能性等级。因此,问题转化为利用各因子指标Iij,求算逻辑回归系数B1, B2, …, Bn。
式(3)和式(5)需要1个统一量纲指标Iij,而表1中各因子量纲和取值范围都不同,因此,首先需要统一各滑坡致灾因子的量纲。本文应用历史滑坡空间分布,实现各因子量纲统一。在ArcMap中将各因子图层分别与历史灾点图层进行叠加,应用GIS空间分析技术得到致灾因子子集中历史灾害面积,由下式计算指标Iij。
将各因子指标Iij作为Logistic回归模型的自变量,灾害是否发生作为因变量。在因子图层和历史灾点图层的叠加过程中,若某不规则单元内有灾害发生,则取值为1,否则,取值为0。利用ArcGIS将图像转化为数字矩阵,将数据导入SPSS统计分析软件[16],采用Binary logistic回归分析,得到贵州省滑坡危险性因子的Logistic回归模型:
根据SPSS得到的结果,显著性值接近于0,说明差异极显著,显著性差异为6 010.809,模型统计通过检验。
统计贵州省内所有不规则单元的指标Iij,运用式(7)和(4),可计算每个不规则单元的滑坡发生概率P。根据所有P,用等要素法将贵州省滑坡危险性进行分级,危险度分区结果如图6所示。根据图6,分别统计各危险级别覆盖的区域面积和历史滑坡面积,结果如表2 所示。由表2可见,危险性级别越高的区域,滑坡面积占分级区域面积的比例就越高,即滑坡灾害密度越大。高危险区和极高危险区集中了大量的滑坡灾害,而低危险区和中等危险区的滑坡分布相对稀疏。这说明本文划分的危险性级别区域符合历史滑坡分布现状,编制的贵州省滑坡危险性区划图合理、有效。
图6 贵州省危险度分区图
Fig.6 Landslide susceptibility map of Guizhou Province
表2 危险性级别
Table 2 Dangerous level
图6表明,在贵州省西部和中部地区滑坡点较多,灾害情况严重,东南部灾点较少。根据表2,贵州省境内低、中、高和极高危险性分级区域面积占贵州省总面积的比例分别为24.2%,37.3%,21.2%和17.3%,说明贵州省约2/3地区属于中、低等地质灾害危险区,约1/3地区属于地质灾害高和极高危险区。
3 结 论
a. 贵州省滑坡主要分布在西部和中部,而东南部灾点较少。低、中、高和极高危险区分别占贵州省面积的24.2%,37.3%,21.2%和17.3%。
b. 根据KCF取值的分布情况,在铁路、公路沿线滑坡灾害发生较多,说明贵州省内人为的环境改造是滑坡灾害产生的主要原因之一,在以后的交通基础设施建设过程中,应尽量避免深挖高填。
c. 根据历史灾点分布情况,应用确定性系数(CF)和Logistic多元回归模型编制贵州省滑坡危险性区划图,能客观评价区域滑坡的危险性程度。
参考文献:
[1] 中国国土资源部. 2007年地质灾害防治取得显著成效[R]. 北京: 中国国土资源部, 2008.
Ministry of Land and Resource of China. Remarkable effect achieved in preventing and controlling geological disasters in 2007[R]. Beijing: Ministry of Land and Resource of China, 2008.
[2] 王卫东, 刘武成. 基于GIS的公路地质灾害信息管理和决策支持系统[J]. 中南工业大学学报: 自然科学版, 2003, 34(5): 302-305.
WANG Wei-dong, LIU Wu-cheng. Road’s geological hazards information management and decision making support system research based on GIS[J]. Journal of Central South University of Technology: Natural Science, 2003, 34(5): 302-305.
[3] Baeza C, Corominas J. Assessment of shallow landslide susceptibility by means of multivariate statistical techniques[J]. Earth Surface Processes and Landforms, 2001, 26(12): 1251-1263.
[4] Clerici A, Perego S, Tellini C, et al. A procedure for landslide susceptibility zonation by the conditional analysis method[J]. Geomorphology, 2002, 48(4): 349-364.
[5] 李雪平. 基于GIS的区域斜坡稳定性评价Logistic回归模型研究[D]. 武汉: 中国地质大学工程学院, 2005.
LI Xue-ping. Study on logistic regression model applied to regional slope stability evaluation based on GIS[D]. Wuhan: Engineering Academy, China University of Geosciences, 2005.
[6] 秦晓敏. 基于GIS的滑坡地质灾害危险性评价研究: 以巩留县为例[D]. 乌鲁木齐: 新疆大学资源与环境科学学院, 2007.
QIN Xiao-min. Based on GIS landslide geological disaster hazard evaluation research: Taking Gongliu county as example[D]. Urumqi: College of Resources & Environmental Science, Xinjiang University, 2007.
[7] Pistocchi A, Luzi L, Napolitano P. The use of predictive modeling techniques for optimal exploitation of spatial databases: a case study in landslide hazard mapping with expert system-like methods[J]. Environmental Geology, 2002, 41(7): 765-775.
[8] Lee S, Ryu J H, Won J S, Park H J. Determination and application of the weights for landslide susceptibility mapping using an artificial neural network[J]. Engineering Geology, 2004, 71(3/4): 289-302.
[9] Refice A, Capolongo D. Probabilistic modeling of uncertainties in earthquake-induced landslide hazard assessment[J]. Computers & Geosciences, 2002, 28(6): 735-749.
[10] Zhou G, Esaki T, Mitani Y, Xie M, et al.Spatial probabilistic modeling of slope failure using an integrated GIS Monte Carlo simulation approach[J]. Engineering Geology, 2003, 68(3/4): 373-386.
[11] WANG Wei-dong, XIE Cui-ming, DU Xiang-gang. Landslides susceptibility mapping based on geographical information system, GuiZhou, south-west China[J]. Environmental Geology, 2009, 58(1): 33-43.
[12] Eastman R. Multi-criteria evaluation and GIS[M]. New York: Wiley, 1999: 493-502.
[13] Jiang H, Eastman J R. Application of fuzzy measures in multicriteria evaluation in GIS[J]. Int J Geog Inf Sci, 2000, 14: 173-184.
[14] 肖 桐. 基于GIS的兰州市滑坡空间模拟研究[D]. 兰州: 兰州大学资源环境学院, 2006.
XIAO Tong. GIS-based research on spatial simulation of landslide in Lanzhou[D]. Lanzhou: College of Earth and Environmental Science, Lanzhou University, 2006.
[15] 丛威青, 潘 懋, 李铁锋, 等. 基于GIS的滑坡、泥石流灾害危险性区划关键问题研究[J]. 地学前缘, 2006, 13(1): 185-190.
CONG Wei-qing, PAN Mao, LI Tie-feng, et al. Key research on landslide and debris flow hazard zonation based on GIS[J]. Earth Science Frontiers, 2006, 13(1): 185-190.
[16] 张文彤. SPSS统计分析教程(高级篇)[M]. 北京: 北京希望电子出版社, 2002.
ZHANG Wen-tong. SPSS statistic analysis tutorial (Advanced piece)[M]. Beijing: Beijing Hope Electronic Press, 2002.
收稿日期:2009-01-12;修回日期:2009-03-25
基金项目:交通部西部项目(200331880201)
通信作者:王卫东(1971-),男,江西上饶人,博士,副教授,从事道路与铁道工程研究;电话:0731-82655765;E-mail: 147745@163.com