简介概要

基于边界混合采样的非均衡数据处理算法

来源期刊:控制与决策2017年第10期

论文作者:冯宏伟 姚博 高原 王惠亚 冯筠

文章页码:1831 - 1836

关键词:非均衡数据;欠采样;变异系数;分类;

摘    要:针对非均衡数据分类效果差的问题,提出一种新的基于边界混合采样的非均衡数据处理方法(BMS).首先通过引进"变异系数"找出样本的边界域和非边界域;然后对边界域中的少数类样本进行过采样,对非边界域中的多数类样本进行随机欠采样,以期达到训练数据基本平衡的目标.实验结果表明,BMS方法比其他3种流行的非均衡数据处理方法在对7个公开数据集的分类性能上平均提高了5%左右,因此,该方法可以广泛应用于非均衡数据的处理和分类中.

详情信息展示

基于边界混合采样的非均衡数据处理算法

冯宏伟1,姚博1,高原2,王惠亚3,冯筠1

1. 西北大学信息科学与技术学院2. 西北大学经济管理学院3. 西北大学数学学院

摘 要:针对非均衡数据分类效果差的问题,提出一种新的基于边界混合采样的非均衡数据处理方法(BMS).首先通过引进"变异系数"找出样本的边界域和非边界域;然后对边界域中的少数类样本进行过采样,对非边界域中的多数类样本进行随机欠采样,以期达到训练数据基本平衡的目标.实验结果表明,BMS方法比其他3种流行的非均衡数据处理方法在对7个公开数据集的分类性能上平均提高了5%左右,因此,该方法可以广泛应用于非均衡数据的处理和分类中.

关键词:非均衡数据;欠采样;变异系数;分类;

<上一页 1 下一页 >

有色金属在线官网  |   会议  |   在线投稿  |   购买纸书  |   科技图书馆

中南大学出版社 技术支持 版权声明   电话:0731-88830515 88830516   传真:0731-88710482   Email:administrator@cnnmol.com

互联网出版许可证:(署)网出证(京)字第342号   京ICP备17050991号-6      京公网安备11010802042557号