不均衡数据下基于阴性免疫的过抽样新算法
来源期刊:控制与决策2010年第6期
论文作者:陶新民 徐晶 童智靖 刘玉
文章页码:867 - 1750
关键词:不均衡数据;阴性免疫;过抽样算法;人工少数类过抽样技术;
摘 要:为提高不均衡数据集下算法分类性能,提出一种基于阴性免疫的过抽样算法.该算法利用阴性免疫实现少数类样本空间覆盖,以生成的检测器中心为人工生成的少数类样本.由于该算法利用的是多数类样本信息生成少数类样本,避免了人工少数类过抽样技术(SMOTE)生成的人工样本缺乏空间代表性的不足.通过实验将此算法与SMOTE算法及其改进算法进行比较,结果表明,该算法不仅有效提高了少数类样本的分类性能,而且总体分类性能也有了显著提高.
陶新民1,徐晶2,童智靖1,刘玉1
1. 哈尔滨工程大学信息与通信工程学院2. 黑龙江省科技学院数力系
摘 要:为提高不均衡数据集下算法分类性能,提出一种基于阴性免疫的过抽样算法.该算法利用阴性免疫实现少数类样本空间覆盖,以生成的检测器中心为人工生成的少数类样本.由于该算法利用的是多数类样本信息生成少数类样本,避免了人工少数类过抽样技术(SMOTE)生成的人工样本缺乏空间代表性的不足.通过实验将此算法与SMOTE算法及其改进算法进行比较,结果表明,该算法不仅有效提高了少数类样本的分类性能,而且总体分类性能也有了显著提高.
关键词:不均衡数据;阴性免疫;过抽样算法;人工少数类过抽样技术;