模糊XML文档与模糊DTD相似性研究
来源期刊:东北大学学报(自然科学版)2017年第2期
论文作者:赵震 马宗民
文章页码:200 - 204
关键词:模糊XML文档;文档类型定义(DTD);相似性;结构匹配;数据整合;
摘 要:在模糊XML数据管理中,模糊XML文档和模糊DTD的相似性是模糊XML数据整合、模糊XML文档聚类的关键步骤.为了研究模糊XML文档和模糊DTD的相似性,对模糊DTD树进行了规则变换,主要解决元素和属性的析取约束和基数约束问题,即由析取范式转化为合取范式,将元素或属性的重复次数确定化,然后利用树编辑距离算法对模糊XML文档树和转化后的模糊DTD树集合进行相似性对比.通过实验验证了所提方法的性能优势.
赵震1,2,马宗民1
1. 东北大学计算机科学与工程学院2. 渤海大学信息科学与技术学院
摘 要:在模糊XML数据管理中,模糊XML文档和模糊DTD的相似性是模糊XML数据整合、模糊XML文档聚类的关键步骤.为了研究模糊XML文档和模糊DTD的相似性,对模糊DTD树进行了规则变换,主要解决元素和属性的析取约束和基数约束问题,即由析取范式转化为合取范式,将元素或属性的重复次数确定化,然后利用树编辑距离算法对模糊XML文档树和转化后的模糊DTD树集合进行相似性对比.通过实验验证了所提方法的性能优势.
关键词:模糊XML文档;文档类型定义(DTD);相似性;结构匹配;数据整合;