基于超立方体与信息熵的离散化方法
来源期刊:工程科学学报2005年第6期
论文作者:鄂旭 高学东 谭文东 王莹
文章页码:760 - 763
关键词:粗糙集;离散化;超立方体;信息熵;
摘 要:针对粗糙集中连续属性需要离散化问题进行了研究.根据数据对象的可分辨性原理构造超立方体,在数据空间上对信息表中的连续属性进行整体离散化处理.根据条件属性与决策属性的一致性关系,依照条件属性在粗糙集边界域中的分类能力来确定条件属性的重要性,在此基础上选取重要划分点对信息表中的连续属性进行局部离散化,同时以信息熵作为迭代约束条件.数值示例和实验表明这种整体与局部相结合的离散化方法是有效可行的.
鄂旭1,高学东2,谭文东1,王莹2
1. 辽宁工学院计算机系2. 北京科技大学管理学院
摘 要:针对粗糙集中连续属性需要离散化问题进行了研究.根据数据对象的可分辨性原理构造超立方体,在数据空间上对信息表中的连续属性进行整体离散化处理.根据条件属性与决策属性的一致性关系,依照条件属性在粗糙集边界域中的分类能力来确定条件属性的重要性,在此基础上选取重要划分点对信息表中的连续属性进行局部离散化,同时以信息熵作为迭代约束条件.数值示例和实验表明这种整体与局部相结合的离散化方法是有效可行的.
关键词:粗糙集;离散化;超立方体;信息熵;