简介概要

基于最大平衡度的自适应随机抽样算法

来源期刊:东北大学学报(自然科学版)2018年第6期

论文作者:董立岩 王越群 李永丽 朱琪

文章页码:792 - 796

关键词:非平衡数据集;最大平衡度;随机抽样;随机森林;数据预处理;

摘    要:针对分类算法在非平衡数据集的情况下分类性能不理想的问题,总结了常见的数据平衡化方法,包括改造数据集与改进算法,提出一种全新的基于最大平衡度的自适应随机抽样算法,进一步优化了随机森林算法的分类效果.将其应用在随机森林算法的数据预处理阶段,并通过实验证明了该随机抽样方法的有效性,在合理的整体精度范围内能够较好地处理非平衡数据.产生的新数据比较拟合初始数据,能够提高分类器处理非平衡数据的能力.

详情信息展示

基于最大平衡度的自适应随机抽样算法

董立岩1,王越群1,李永丽2,朱琪1

1. 吉林大学计算机科学与技术学院2. 东北师范大学计算机科学与信息技术学院

摘 要:针对分类算法在非平衡数据集的情况下分类性能不理想的问题,总结了常见的数据平衡化方法,包括改造数据集与改进算法,提出一种全新的基于最大平衡度的自适应随机抽样算法,进一步优化了随机森林算法的分类效果.将其应用在随机森林算法的数据预处理阶段,并通过实验证明了该随机抽样方法的有效性,在合理的整体精度范围内能够较好地处理非平衡数据.产生的新数据比较拟合初始数据,能够提高分类器处理非平衡数据的能力.

关键词:非平衡数据集;最大平衡度;随机抽样;随机森林;数据预处理;

<上一页 1 下一页 >

有色金属在线官网  |   会议  |   在线投稿  |   购买纸书  |   科技图书馆

中南大学出版社 技术支持 版权声明   电话:0731-88830515 88830516   传真:0731-88710482   Email:administrator@cnnmol.com

互联网出版许可证:(署)网出证(京)字第342号   京ICP备17050991号-6      京公网安备11010802042557号