基于本体的突发事件领域知识建模
杨月华,杜军平,梁美玉
(北京邮电大学 计算机学院 智能通信软件与多媒体北京市重点实验室,北京,100876)
摘要:结合突发事件的普遍规律,采用知识获取方法获得突发事件领域的主要概念和概念之间的关系,应用本体建模工具Protégé,对基于本体的突发事件领域知识模型的构建进行研究,建立突发事件领域本体模型。研究结果表明:建立的模型描述了知识点之间的语义关系,概念间关系逻辑严密,支持语义逻辑上的推理,可扩展性强。
关键词:突发事件;本体建模;OWL;知识获取
中图分类号:TP391.1 文献标志码:A 文章编号:1672-7207(2011)S1-859-06
Emergency domain knowledge modeling based on ontology
YANG Yue-hua, DU Jun-ping, LIANG Mei-yu
(Beijing Key Lab of Intelligent Telecommunication Software and Multimedia, School of Computer Science, Beijing University of Posts and Telecommunications, Beijing 100876, China)
Abstract: Combining the universal law of emergency, the important concepts and conceptual relations were obtained through a variety of knowledge acquisition methods, and the emergency domain ontology modeling was studied and completed with the ontology modeling tool Protégé. The results show that the model established describes the semantic relations between knowledge points; the logic between the relations of concepts is strict, support semantic logical reasoning, and has a strong scalability.
Key words: emergency; ontology modeling; OWL; knowledge acquisition
近年来,我国突发事件接连发生,呈现爆发日趋频繁、破坏日趋严重的态势。突发事件应对问题成为人们关心、社会关注、国家重视的热点,引起了越来越多学者的重视和研究。本体理论和技术的发展与应用为调查突发事件及进行突发事件领域专项研究提供了一种新的途径[1]。将本体技术应用到突发事件领域中,通过对突发事件对象进行分析,确定突发事件领域的概念以及概念之间的关系,进而创建突发事件领域本体模型并进行推理应用,对于实现突发事件领域知识的共享和重用具有重要意义[2-3]。目前国内外关于基于本体的突发事件领域知识建模的研究较少,为此,本文作者结合突发事件的普遍规律,通过各种知识获取方法获得突发事件领域的主要概念和概念之间的关系,使用本体建模工具Protégé完成突发事件领域本体建模,描述知识点之间的语义关系,支持语义逻辑上的推理,解决现实领域知识到计算机可以理解的形式化编码的转化等问题,使本体的重用成为可能。
1 本体
本体是共享概念模型的明确的形式化规范说明。它具有领域对象描述手段和描述方法,能以明确一致的方式表达概念的内涵,可以清晰描述领域知识库中的概念及其关系,实现领域知识的共享和重用。利用本体进行知识建模,信息更加便于查找,模型更加易于维护。模型的形式化准确表述也大大提高了可靠 性,使知识模型各个层次的系统组织结构更加清晰完善[4]。
定义 本体O(C,R,F,A,I),是一个五元组,其中:
(1) C是概念集。它的每一个元素都是需要进行规范化描述的概念,也称为类。
(2) R是关系的集合。概念的语义通过概念间的关系描述,R是概念集C上的二元关系的集合。关系的类型为一对一、多对一和多对多。除了二元关系,概念间也存在多元关系。领域中常用到的概念间的基本关系有Kind-of继承关系、Part-of组合关系、Attribute-of属性关系、Has拥有关系等。在实际的应用中,概念之间的关系不仅限于上面的几种基本关系,在领域本体实际建模过程中,概念之间的关系可以根据特定领域的具体情况定义相应的关系,以满足应用的需要。
(3) F是函数。函数是一类特殊的关系,该关系的前n-1个元素可以唯一决定第n个元素,形式化的定义为F: C1×C2 ×…×Cn-1→Cn。例如,函数mother-of( )是将某个人或生物与他(它)的母亲联系到一起。对于任何人或生物而言,mother-of()的值是唯一的,而mother-of( )的逆反函数children-of( )的值不一定是唯一的。
(4) A是公理集。a∈A为本体中的公理。以永真断言表达了对本体描述概念的判断。从某种意义上来说,属性和关系可以看作公理的一种。公理可用于约束信息,证明正确性或者导出新信息,对公理的需要是依赖于具体应用的。此外,公理还包含更一般的规则,例如:一辆车至少能载一个人。
(5) I是实例集。实例是对抽象类对象的实例化描述。
其中:F和I不是必需的,可视本体建模的详尽程度而取舍。
目前本体的构建工具主要有Ontolingua、WebOnto、OntoSaurus、Protégé、WebODE、OntoEdit等。本文采用Protégé作为本体建模工具,Protégé+ OWL plug-in插件是由美国Stanford大学用Java开发的本体编辑器,具有如下优点:能够编辑和定义本体的类及类关系、属性、实例;实现本体推理;支持数据库存储[3]。本体的描述语言主要有RDF和RDFS、OIL、DAML、SHOE、XOL、OWL等。其中OWL(Web Ontology Language)是W3C推荐的语义网中本体描述语言的标准,W3C的设计人员针对各类特征的需求制定了3种相应的OWL的子语言,即OWL由OWL Lite、OWL DL和OWL Full这3个表达能力递增的子语言组成。本文的研究以OWL DL为基础。
2 突发事件领域本体建模
面向突发事件领域的本体建模使用本体的建模语言和建模工具,对突发事件领域的共享概念进行明确的、形式化的规范说明。本文结合突发事件的普遍规律,通过各种知识获取方法获得突发事件领域的主要概念和概念之间的关系,用精确的语言加以描述,借助Protégé工具完成突发事件领域本体建模。
2.1 突发事件领域概念获取
首先需要获取概念并定义类。通过收集突发事件领域的知识信息,充分了解知识的组织结构,从领域专家、专业权威书刊、网络以及已有的相关本体中获取重点概念,并对这些概念进行分析抽象和归纳,依据概念唯一性、同级概念间互不相交、并集覆盖整个父类概念范围的要求,并形成以继承关系为主要关系的层级模型。
(1) 事件。突发事件的发生是很复杂的,往往不是只存在一种突发事件类型。在通常情况下,原生事件产生后,会伴随着次生事件和衍生事件的发生[5]。次生事件是指由原生事件诱导出来的,例如地震事件会引发火灾、瘟疫流行等。衍生事件是指由原生事件派生出来的、第三次生成的、因繁衍变化而发生的一系列事件。
(2) 级别。为了有效处置各类突发公共事件,依据突发公共事件可能造成的危害程度、可控性、影响范围等情况,由高到低划分为特别重大(Ⅰ级)、重大(Ⅱ级)、较大(Ⅲ级)、一般(Ⅳ级)4个级别。突发事件的危害包括环境破坏、生命损伤和财产损失,危害程度可由这3个指标来衡量。
(3) 阶段。突发事件的变化呈现一定的周期性。无论是哪种类型的突发事件,从发展过程来看都通常经历潜伏期、爆发期和恢复期几个阶段。在潜伏阶段,外界环境存在着引发突发事件系统状态变化的可能性;爆发期,突发事件全面爆发,破坏性非常大;恢复期,外部环境呈现新的有序状态,突发事件处于恢复阶段,状态趋于稳定。可根据突发事件每个阶段的持续时间、破坏性、状态指标和环境向量来形成相关的措施进行减灾、防灾和灾后恢复。环境向量包括自然环境、社会环境和人为技术环境。
(4) 应对。在可能发生或即将发生突发事件时,政府部门、遭遇突发事件的个人和社会民众会分别进行不同的活动。个人在遭遇突发事件时,要进行避灾和自救。在这个过程中,政府首先要进行预测预警,主要是进行信息收集、分析和评估及发布;突发事件爆发后,进行应急响应,一般会分级响应和启动应急预案,当所发生的突发事件没有对应的应急预案时,根据突发事件的特征采取应对措施;突发事件结束后,政府部门要做好善后处理,进行恢复和重建工作[6-7]。
(5) 资源。为了更好地应对突发事件,需要提供充足的人力、物力和财力资源,其中,人力资源包括决策人员、专家、医疗人员、武警人员、消防人员等;物力资源包括救援装备、通信设备、医疗设备、交通设施和生活必需品,生活必需品主要是食品、水和衣物。
概念层次结构是突发事件领域知识模型的框架,概念间的关系才是领域知识模型的核心。突发事件概念之间存在的代表性关系如表1所示。
2.2 利用Protégé工具进行突发事件领域本体建模
Protégé是由斯坦福大学的Stanford Medical Informatics开发的一个开放源码的本体编辑器,本体结构以树状的层次目录结构显示,可以通过单击相应的项目来增加或编辑类、子类、属性、实例等。可以在概念层次上进行领域模型设计,而且可扩展,后台支持数据库存储,基于本体的突发事件领域知识模型的创建如图1和图2所示,最终建立的模型如图3所示,其中显示的不同颜色的线对应表1中所列的概念之间的各种关系。
图1 概念层次
Fig.1 Hierarchy of concepts
表1 突发事件概念之间存在的代表性关系
Table 1 Representative relation between concepts of emergency
图2 属性和概念间关系的设置
Fig.2 Setting of properties and relations between concepts
当突发事件领域本体模型利用Protégé建立起来后可以得到一个形式化的OWL文件,里面定义了基本的概念、关系和实例,这可以看做是基本的突发事件本体知识库,可以用于实现语义推理和检索。其中部分代表性的代码片段如下:
xml:base="http://www.semanticweb.org/ontologies/2011/0/EmergencyOntology.owl"
xmlns:xsd="http://www.w3.org/2001/XMLSchema#"
xmlns:xml="http://www.w3.org/XML/1998/namespace"
xmlns:rdfs=http://www.w3.org/2000/01/rdf-schema#
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
//声明SecondaryEvent类,它是Event类的子类
//定义定义域为SecondaryEvent的对象属性Cause
//定义次生事件引起衍生事件
//添加原生事件的实例Foodsecurity
图3 基于本体的突发事件领域知识模型
Fig.3 Emergency domain knowledge model based on ontology
3 突发事件领域本体模型评价
一个构建良好的领域本体模型应该概念完整、清晰、一致,具有可扩展性和兼容性。完整性是指本体是否包括了该领域的重要概念,概念及关系是否完整,概念的等级、层次是否多样化。清晰性是指对于知识概念的定义是否清晰无歧义。一致性是指本体中的概念间的关系在逻辑上是否严密、一致,能否支持本体在语义逻辑上的推理。可扩展性是指本体可否顺利实施进化,本体能否在层次结构上可扩充,在语义上可丰富与完善,能否加入新的术语概念。兼容性是指本体的开放性和互操作性,本体能否和其他领域本体及相关资源系统进行映射,包括系统层、逻辑层、语义层、表现层等的兼容和互操作[8-9]。
本文根据突发事件领域本体评价的指标,选取了相关学科专家和本体研究人员作为调查对象,对所构建的本体进行了评价,评价结果如表2所示。结果表明:本文创建的突发事件领域本体模型包含了突发事件领域的主要概念及概念间的关系,且概念的层级多样化,完整性较好。概念定义清晰、明确、严格、无歧义,概念间的关系在逻辑上符合严密性和一致性,支持语义逻辑上的推理。本体的可扩展性强,方便加入新概念。因此,本文建立的突发事件领域本体模型在实际中是可用的。
表2 突发事件领域本体模型评价结果
Table 2 Evaluation results of emergency domain ontology model
4 结论
(1) 本文对基于本体的突发事件领域知识模型的构建进行研究,建立突发事件领域本体模型,描述知识点之间的语义关系,支持语义逻辑上的推理。
(2) 建立的本体模型仍需要进一步完善,需要实现语义的自动标注,避免繁杂工作靠人力解决的弊端。
(3) 还应从语义层次来理解用户的查询意图,将符合用户意图的结果输出,即基于突发事件本体模型实现语义检索。
参考文献:
[1] 袁占花. 基于本体论的应急系统知识库建模的研究[D]. 太原: 太原理工大学, 2005.
YUAN Zhan-hua. A study of ontology-based knowledge base modeling for emergency system[D]. Taiyuan: Taiyuan University of Technology, 2005.
[2] LI Xiang, LIU Gang, LING An-hong, et al. Building a practical ontology for emergency response systems[C]//Proceedings of 2008 International Conference on Computer Science and Software Engineering. 2008: 222-225.
[3] YU Kai, WANG Qing-quan, RONG Li-li. Emergency ontology construction in emergency decision support system[C]// Proceedings of 2008 IEEE International Conference on Service Operations and Logistics, and Informatics. 2008: 801-805.
[4] 吴坤. 基于Ontology的外汇领域知识库的研究和实现[D]. 杭州: 浙江大学, 2010.
WU Kun. Research and design of a knowledge base in foreign exchange domain[D]. Hangzhou: Zhejiang University, 2010.
[5] 温立. 基于本体的应急决策知识模型研究[D]. 大连: 大连理工大学, 2008.
WEN Li. The study of ontology for knowledge model based on emergency decision-making[D]. Dalian: Dalian University of Technology, 2009.
[6] 国家突发公共事件预案体系[OL/EB]. http://www. gov.cn/yjgl/2005-08/31/content_27872.htm.
System of national emergency plan[OL/EB]. http://www. gov.cn/yjgl/2005-08/31/content_27872.htm.
[7] 中华人民共和国突发事件应对法[OL/EB]. http://www.gov.cn/ziliao/flfg/2007-08/30/content_ 732593.htm.
Emergency Response Law of The People’ Republic of China [OL/EB]. http://www.gov.cn/ziliao/flfg/2007-08/30/content_ 732593.htm.
[8] 谢娟. 教学领域本体构建研究[D]. 曲阜: 曲阜师范大学, 2010.
XIE Juan. Study on construction of teaching domain ontology[D]. Qufu: Shandong Qufu Normal University, 2010.
[9] 马文峰, 杜小勇, 等. 领域本体评价研究[J]. 图书情报工作, 2006(10): 68-71.
MA Wen-feng, DU Xiao-yong. An evaluation framework for domain ontology[J]. Library and Information Service, 2006(10): 68-71.
(编辑 何学锋)
收稿日期:2011-04-15;修回日期:2011-06-15
基金项目:国家自然科学基金资助项目(91024001,61070142);北京市自然科学基金资助项目(4111002)
通信作者:杜军平(1963-),女,河北保定人,教授,从事智能信息处理研究;电话:13501233431;E-mail: junpingdu@126.com