基于谱聚类欠取样的不均衡数据SVM分类算法
来源期刊:控制与决策2012年第12期
论文作者:陶新民 张冬雪 郝思媛 付丹丹
文章页码:1761 - 3543
关键词:不均衡数据;SVM算法;谱聚类;欠取样;
摘 要:提出一种基于谱聚类欠取样的不均衡数据支持向量机(SVM)分类算法.该算法首先在核空间中对多数类样本进行谱聚类;然后在每个聚类中根据聚类大小和该聚类与少数类样本间的距离,选择具有代表意义的信息点;最终实现训练样本间的数目均衡.实验中将该算法同其他不均衡数据预处理方法相比较,结果表明该算法不仅能有效提高SVM算法对少数类的分类性能,而且总体分类性能及运行效率都有明显提高.
陶新民,张冬雪,郝思媛,付丹丹
哈尔滨工程大学信息与通信工程学院
摘 要:提出一种基于谱聚类欠取样的不均衡数据支持向量机(SVM)分类算法.该算法首先在核空间中对多数类样本进行谱聚类;然后在每个聚类中根据聚类大小和该聚类与少数类样本间的距离,选择具有代表意义的信息点;最终实现训练样本间的数目均衡.实验中将该算法同其他不均衡数据预处理方法相比较,结果表明该算法不仅能有效提高SVM算法对少数类的分类性能,而且总体分类性能及运行效率都有明显提高.
关键词:不均衡数据;SVM算法;谱聚类;欠取样;