基于数据挖掘技术的网站用户分析
来源期刊:昆明理工大学学报(自然科学版)2007年第2期
论文作者:漆超 江嘉
文章页码:48 - 51
关键词:聚类分析;层次聚类;网站日志;
摘 要:采用数据挖掘中的聚类技术,对微软网站日志文件中的用户行为数据进行分析,在用户行为的基础上将用户归为同质的组,从而寻求一种识别典型访问情况的方法.采用了一种“将SPR-SQ减小的情况屏蔽,只考虑SPRSQ增加的情况”的处理方法,来实现最佳聚类个数K的选择.同时,在计算组内偏差的时候,提出了“冗余组内偏差”的概念.在聚类分析阶段完成之后,对每个聚类结果进行“标准化均值”比较,并对其用户行为作了简要分析.
漆超,江嘉
摘 要:采用数据挖掘中的聚类技术,对微软网站日志文件中的用户行为数据进行分析,在用户行为的基础上将用户归为同质的组,从而寻求一种识别典型访问情况的方法.采用了一种“将SPR-SQ减小的情况屏蔽,只考虑SPRSQ增加的情况”的处理方法,来实现最佳聚类个数K的选择.同时,在计算组内偏差的时候,提出了“冗余组内偏差”的概念.在聚类分析阶段完成之后,对每个聚类结果进行“标准化均值”比较,并对其用户行为作了简要分析.
关键词:聚类分析;层次聚类;网站日志;