一种基于密度和距离的K-means聚类算法
来源期刊:软件工程2020年第10期
论文作者:罗军锋 洪丹丹
文章页码:23 - 29
关键词:聚类;K-means;特征加权;近邻密度;孤立点;
摘 要:针对K-means算法中对初始聚类中心和孤立点敏感的缺点,我们通过从密度和距离两个方面的改进,提出新的改进K-means算法。该算法引入特征权重,从近邻密度出发,去除孤立点对算法的影响,同时确定初始聚类中心,在距离计算过程中,引入集成簇内与簇间距离的计算方法,以提升聚类的效果。实验结果表明,该算法比传统聚类算法能够提升10%以上的聚类效果。
罗军锋,洪丹丹
西安交通大学网络信息中心
摘 要:针对K-means算法中对初始聚类中心和孤立点敏感的缺点,我们通过从密度和距离两个方面的改进,提出新的改进K-means算法。该算法引入特征权重,从近邻密度出发,去除孤立点对算法的影响,同时确定初始聚类中心,在距离计算过程中,引入集成簇内与簇间距离的计算方法,以提升聚类的效果。实验结果表明,该算法比传统聚类算法能够提升10%以上的聚类效果。
关键词:聚类;K-means;特征加权;近邻密度;孤立点;