基于邻域组合测度的属性约简方法
来源期刊:控制与决策2016年第7期
论文作者:何松华 康婵娟 鲁敏 滕书华
文章页码:1225 - 1230
关键词:粗糙集;属性约简;不确定性度量;不完备信息系统;混合数据;
摘 要:属性约简是机器学习和知识发现的研究热点,而属性重要性度量则是构建属性约简算法的关键环节.针对不完备的混合型信息系统,在邻域关系下定义了一种新的属性集成重要性度量—–邻域组合测度,并据此提出一种基于邻域组合测度的属性约简(NCMAR)算法.通过多个UCI数据集上的实验表明,NCMAR算法不仅能够直接处理符号和数值属性共存的混合信息系统,而且适用于不完备信息系统,在获得较小约简结果的同时,能够保证较高的分类精度.
何松华1,康婵娟1,2,鲁敏2,滕书华2
1. 湖南大学信息科学与工程学院2. 国防科技大学自动目标识别重点实验室
摘 要:属性约简是机器学习和知识发现的研究热点,而属性重要性度量则是构建属性约简算法的关键环节.针对不完备的混合型信息系统,在邻域关系下定义了一种新的属性集成重要性度量—–邻域组合测度,并据此提出一种基于邻域组合测度的属性约简(NCMAR)算法.通过多个UCI数据集上的实验表明,NCMAR算法不仅能够直接处理符号和数值属性共存的混合信息系统,而且适用于不完备信息系统,在获得较小约简结果的同时,能够保证较高的分类精度.
关键词:粗糙集;属性约简;不确定性度量;不完备信息系统;混合数据;