基于多代表点的大规模数据模糊聚类算法
来源期刊:控制与决策2016年第12期
论文作者:陈爱国 王士同
文章页码:2122 - 2130
关键词:大规模数据;模糊聚类;增量式聚类;多代表点;
摘 要:针对传统模糊聚类在大规模数据场景下,由于内存的限制不能一次装载所有数据,以及在通过聚类捕捉数据的潜在结构和描述各个类时仅使用单个代表点存在信息量不足的问题,提出一种基于多代表点的大规模数据模糊聚类算法.该算法通过对大规模数据进行分块,在对每个数据块进行聚类时使用多个代表点描述捕捉到的数据的潜在结构和各个类信息,并通过考虑代表点与代表点之间在聚类过程中的约束关系,提高最后聚类结果的精度.在模拟数据集和真实数据集上的3组实验验证了所提出算法的有效性.
陈爱国,王士同
江南大学数字媒体学院
摘 要:针对传统模糊聚类在大规模数据场景下,由于内存的限制不能一次装载所有数据,以及在通过聚类捕捉数据的潜在结构和描述各个类时仅使用单个代表点存在信息量不足的问题,提出一种基于多代表点的大规模数据模糊聚类算法.该算法通过对大规模数据进行分块,在对每个数据块进行聚类时使用多个代表点描述捕捉到的数据的潜在结构和各个类信息,并通过考虑代表点与代表点之间在聚类过程中的约束关系,提高最后聚类结果的精度.在模拟数据集和真实数据集上的3组实验验证了所提出算法的有效性.
关键词:大规模数据;模糊聚类;增量式聚类;多代表点;