基于三支决策的KNN增量算法
来源期刊:控制工程2020年第4期
论文作者:裴晓鹏 尚奥 刘美红 刘帆 陈泽华
文章页码:656 - 661
关键词:k-近邻算法;三支决策;边界域;增量式算法;
摘 要:k-近邻(k-Nearest Neighbour,KNN)算法是一种有效的多分类算法,他具有简单、稳定的特点,在数据挖掘领域得到了广泛的应用。但是有2个主要缺点,一是算法的准确度与k值有很大关系,不同的k值会导致准确率有很大的不同;二是他属于非增量式算法,随着数据量的增加,算法的分类速度会越来越慢,影响他在海量数据分析中的应用。三支决策的主要思想是将整体分成3个独立的部分,引入了不承诺的决策选项,规避了错误接受或者错误拒绝的损失。把三支决策思想引入KNN算法,对边界域样本特殊处理,会减小分类代价,提高海量数据处理的正确性,同时对KNN算法进行改进,提出了一种基于三枝决策的KNN增量式算法,提高了原有算法的快速性。
裴晓鹏1,尚奥1,刘美红2,刘帆1,陈泽华1
1. 太原理工大学信息工程学院2. 山西大学自动化系
摘 要:k-近邻(k-Nearest Neighbour,KNN)算法是一种有效的多分类算法,他具有简单、稳定的特点,在数据挖掘领域得到了广泛的应用。但是有2个主要缺点,一是算法的准确度与k值有很大关系,不同的k值会导致准确率有很大的不同;二是他属于非增量式算法,随着数据量的增加,算法的分类速度会越来越慢,影响他在海量数据分析中的应用。三支决策的主要思想是将整体分成3个独立的部分,引入了不承诺的决策选项,规避了错误接受或者错误拒绝的损失。把三支决策思想引入KNN算法,对边界域样本特殊处理,会减小分类代价,提高海量数据处理的正确性,同时对KNN算法进行改进,提出了一种基于三枝决策的KNN增量式算法,提高了原有算法的快速性。
关键词:k-近邻算法;三支决策;边界域;增量式算法;