基于粗糙集和决策树的数据挖掘方法
来源期刊:东北大学学报(自然科学版)2006年第5期
论文作者:吴成东 许可 韩中华 裴涛
文章页码:481 - 484
关键词:粗糙集;决策树;数据离散化;数据挖掘;谱系聚类;属性约简;
摘 要:从粗糙集和决策树两种方法具有的优势互补性出发,提出了一种基于粗糙集和决策树相结合的数据挖掘新方法·以胶合板缺陷检测数据分析为应用对象,利用粗糙集理论对胶合板数据库中的特征信息进行缺陷识别·利用谱系聚类重心距离法对数据进行离散化处理,采用粗糙集进行属性约简,得到低维样本数据,最后用决策树方法产生决策规则·实验证明,这种数据挖掘方法保留了原始数据的内部特点,加快了获取知识的进程,提高了模型的分类准确率,增强了规则的可解释性,取得了满意的研究结果·
吴成东1,许可2,韩中华2,裴涛2
1. 东北大学信息科学与工程学院2. 沈阳建筑大学信息与控制工程学院
摘 要:从粗糙集和决策树两种方法具有的优势互补性出发,提出了一种基于粗糙集和决策树相结合的数据挖掘新方法·以胶合板缺陷检测数据分析为应用对象,利用粗糙集理论对胶合板数据库中的特征信息进行缺陷识别·利用谱系聚类重心距离法对数据进行离散化处理,采用粗糙集进行属性约简,得到低维样本数据,最后用决策树方法产生决策规则·实验证明,这种数据挖掘方法保留了原始数据的内部特点,加快了获取知识的进程,提高了模型的分类准确率,增强了规则的可解释性,取得了满意的研究结果·
关键词:粗糙集;决策树;数据离散化;数据挖掘;谱系聚类;属性约简;