一种不完备信息表的预处理方法
来源期刊:工程科学学报2006年第9期
论文作者:鄂旭 高学东 邵良杉 叶柏青
文章页码:902 - 906
关键词:不完备信息表;粗糙集;信息熵;属性约简;离散化;
摘 要:针对不完备信息表预处理问题中的不完备数据的填补问题、冗余属性的约简问题和连续属性的离散化问题进行了研究.应用粗糙集理论,由相容信息表中条件属性与决策属性间的一致性对应关系,定义了划分区间的加法运算,解决了不完备数据填补问题;根据类别概念,定义了差别向量,利用差别向量加法运算删除了冗余属性;根据条件属性与决策属性之间的依赖关系及相对信息熵概念,实现了连续属性的离散化.数值示例和实验结果显示此方法是有效可行的.
鄂旭1,高学东2,邵良杉3,叶柏青3
1. 辽宁工学院计算机系2. 北京科技大学管理学院3. 辽宁工程技术大学管理学院
摘 要:针对不完备信息表预处理问题中的不完备数据的填补问题、冗余属性的约简问题和连续属性的离散化问题进行了研究.应用粗糙集理论,由相容信息表中条件属性与决策属性间的一致性对应关系,定义了划分区间的加法运算,解决了不完备数据填补问题;根据类别概念,定义了差别向量,利用差别向量加法运算删除了冗余属性;根据条件属性与决策属性之间的依赖关系及相对信息熵概念,实现了连续属性的离散化.数值示例和实验结果显示此方法是有效可行的.
关键词:不完备信息表;粗糙集;信息熵;属性约简;离散化;