基于连通分量的分类变量聚类算法
来源期刊:控制与决策2015年第1期
论文作者:周红芳 周扬 张晓鹏 谈姝辰
文章页码:39 - 45
关键词:聚类;分类变量;相似度;连通分量;聚类精度;
摘 要:针对分类变量相似度定义存在的不足,提出一种新的相似度定义.利用新的相似度定义,将数据集抽象为无向图,将聚类过程转化为求无向图连通分量的过程,进而提出一种基于连通分量的分类变量聚类算法.为了定量地分析该算法的聚类效果,针对类别归属已知的数据集,提出一种新的聚类结果评价指标.实验结果表明,所提出的算法具有较高的聚类精度和聚类效率.
周红芳1,周扬1,张晓鹏2,谈姝辰1
1. 西安理工大学计算机科学与工程学院2. 陕西应用物理化学研究所
摘 要:针对分类变量相似度定义存在的不足,提出一种新的相似度定义.利用新的相似度定义,将数据集抽象为无向图,将聚类过程转化为求无向图连通分量的过程,进而提出一种基于连通分量的分类变量聚类算法.为了定量地分析该算法的聚类效果,针对类别归属已知的数据集,提出一种新的聚类结果评价指标.实验结果表明,所提出的算法具有较高的聚类精度和聚类效率.
关键词:聚类;分类变量;相似度;连通分量;聚类精度;